python批量下载壁纸的实现代码
#! /usr/bin/env python
##python2.7-批量下载壁纸
##壁纸来自桌酷网站,所有权归属其网站
##本代码仅做为交流学习使用,请勿用于商业用途,否则后果自负
##Code by Dreamlikes
import re,urllib,urllib2
#保存图片的路径
savepath = 'd:\\picture\\'
#壁纸集合的URL,如下
url = 'http://www.zhuoku.com/zhuomianbizhi/game-gamewall/20120503162540.htm'
urlSource = urllib.urlopen(url).read()
pattern = re.compile(r'<a href="(\d+\(\d+\)\.htm)" ', re.M | re.S)
match = pattern.findall(urlSource)
if match:
for subUrl in match:
subUrlSource = urllib.urlopen(url[0:url.rfind('/')+1]+subUrl).read()
sPattern = re.compile(r'var thunder_url = "(.*)";')
picUrl = sPattern.findall(subUrlSource)[0]
getPic = urllib2.Request(picUrl)
getPic.add_header('Referer','http://www.zhuoku.com')
f = open(savepath+picUrl[picUrl.rfind('/')+1:],'wb')
f.write(urllib2.urlopen(getPic).read())
f.close()
print "All done."
相关推荐
-
Python实现批量下载文件
Python实现批量下载文件 #!/usr/bin/env python # -*- coding:utf-8 -*- from gevent import monkey monkey.patch_all() from gevent.pool import Pool import requests import sys import os def download(url): chrome = 'Mozilla/5.0 (X11; Linux i86_64) AppleWebKit/537.36
-
利用python写个下载teahour音频的小脚本
前言 最近空闲的时候看到了之前就关注的一个小站http://teahour.fm/,一直想把这里的音频都听一遍,可转眼间怎么着也有两年了,却什么也没做.有些伤感,于是就写了个脚本,抓了下音频的下载链接,等下载下来后一定要认真听听. 时间仓促,加调试也就那么十几分钟,脚本写的可能有些烂,大家可以留言指出. teahour.py #!/usr/bin/env python #coding: utf-8 import sys import requests from BeautifulSoup imp
-
使用Python编写简单网络爬虫抓取视频下载资源
我第一次接触爬虫这东西是在今年的5月份,当时写了一个博客搜索引擎,所用到的爬虫也挺智能的,起码比电影来了这个站用到的爬虫水平高多了! 回到用Python写爬虫的话题. Python一直是我主要使用的脚本语言,没有之一.Python的语言简洁灵活,标准库功能强大,平常可以用作计算器,文本编码转换,图片处理,批量下载,批量处理文本等.总之我很喜欢,也越用越上手,这么好用的一个工具,一般人我不告诉他... 因为其强大的字符串处理能力,以及urllib2,cookielib,re,threading这些
-
python实现爬虫下载漫画示例
复制代码 代码如下: #!/usr/bin/python3.2import os,socketimport urllibimport urllib.request,threading,timeimport re,sysglobal manhuaweb,weburl,floder,chapterbegin,currentthreadnum,threadcount,mutex,mutex2 weburl=''floder=''chapterbegin=0currentthreadnum=0threa
-
用Python实现一个简单的能够上传下载的HTTP服务器
#!/usr/bin/env python #coding=utf-8 # modifyDate: 20120808 ~ 20120810 # 原作者为:bones7456, http://li2z.cn/ # 修改者为:decli@qq.com # v1.2,changeLog: # +: 文件日期/时间/颜色显示.多线程支持.主页跳转 # -: 解决不同浏览器下上传文件名乱码问题:仅IE,其它浏览器暂时没处理. # -: 一些路径显示的bug,主要是 cgi.escape() 转义问题 #
-
Python3访问并下载网页内容的方法
本文实例讲述了Python3访问并下载网页内容的方法.分享给大家供大家参考.具体如下: #!/usr/local/bin/python3.2 import urllib.request,io,os,sys req = urllib.request.Request("http://www.google.com") f = urllib.request.urlopen(req) s = f.read() s = s.decode('gbk','ignore') mdir = sys.pat
-
python批量下载图片的三种方法
有三种方法,一是用微软提供的扩展库win32com来操作IE,二是用selenium的webdriver,三是用python自带的HTMLParser解析.win32com可以获得类似js里面的document对象,但貌似是只读的(文档都没找到).selenium则提供了Chrome,IE,FireFox等的支持,每种浏览器都有execute_script和find_element_by_xx方法,可以方便的执行js脚本(包括修改元素)和读取html里面的元素.不足是selenium只提供对py
-
python实现爬虫下载美女图片
本次爬取的贴吧是百度的美女吧,给广大男同胞们一些激励 在爬取之前需要在浏览器先登录百度贴吧的帐号,各位也可以在代码中使用post提交或者加入cookie 爬行地址:http://tieba.baidu.com/f?kw=%E7%BE%8E%E5%A5%B3&ie=utf-8&pn=0 #-*- coding:utf-8 -*- import urllib2 import re import requests from lxml import etree 这些是要导入的库,代码并没有使用正则
-
python爬虫教程之爬取百度贴吧并下载的示例
测试url:http://tieba.baidu.com/p/27141123322?pn=begin 1end 4 复制代码 代码如下: import string ,urllib2 def baidu_tieba(url,begin_page,end_page): for i in range(begin_page, end_page+1): sName = string.zfill(i,5)+ '.html' print '正在下载第' + str(
-
python实现支持目录FTP上传下载文件的方法
本文实例讲述了python实现支持目录FTP上传下载文件的方法.分享给大家供大家参考.具体如下: 该程序支持ftp上传下载文件和目录.适用于windows和linux平台. #!/usr/bin/env python # -*- coding: utf-8 -*- import ftplib import os import sys class FTPSync(object): conn = ftplib.FTP() def __init__(self,host,port=21): self.c
随机推荐
- IE的不合理设计和Bugs
- 为什么在重写 equals方法的同时必须重写 hashcode方法
- 深入解析Java编程中接口的运用
- IOS 开发之NSURL基本操作
- 解析php中如何调用用户自定义函数
- php 删除无限级目录与文件代码共享
- PHP两种去掉数组重复值的方法比较
- PHP中使用file_get_contents post数据代码例子
- vue2.0开发入门笔记之.vue文件的生成和使用
- MySQL利用AES_ENCRYPT()与AES_DECRYPT()加解密的正确方法示例
- 浅谈js数组和splice的用法
- 基于JAVA中Jersey处理Http协议中的Multipart的详解
- Jquery 自定义动画概述及示例
- 批处理与python代码混合编程的方法
- C++智能指针shared_ptr分析
- C++中的内存分区介绍
- 一个月入门Python爬虫学习,轻松爬取大规模数据
- Python爬虫设置代理IP的方法(爬虫技巧)
- Java面向对象编程之类的继承详解
- C#中的应用程序接口介绍及实现,密封类与密封方法