Python获取网页上图片下载地址的方法
本文实例讲述了Python获取网页上图片下载地址的方法。分享给大家供大家参考。具体如下:
这里获取网页上图片的下载地址是正在写的数据采集中的一段,代码如下:
#!/user/bin/python3
import urllib2
from HTMLParser import HTMLParser
class MyHtmlParser(HTMLParser):
links = []
def handle_starttag(self, tag, attrs):
if tag == "img":
if len(attrs) == 0:
pass
else:
for name, value in attrs:
if name == "src":
self.links.append(value)
if __name__ == "__main__":
uri = "http://dy.163.com/v2/article/T1374483113516/AGSNE9L000964K4O"
file = urllib2.urlopen(uri).read()
# file = "<html><h1>Title</h1><p>I'm a paragraph!</p></html>"
hy = MyHtmlParser()
hy.feed(file)
hy.close()
print(hy.links)
希望本文所述对大家的Python程序设计有所帮助。
相关推荐
-
python在多玩图片上下载妹子图的实现代码
复制代码 代码如下: # -*- coding:utf-8 -*-import httplibimport urllibimport stringimport redef getContent(): #从网站中获取所有内容 conn = httplib.HTTPConnection("tu.duowan.com") conn.request("GET", "/m/meinv/index.html") r = c
-
使用Python下载Bing图片(代码)
直接上代码: 复制代码 代码如下: <span style="font-family: arial,helvetica,sans-serif; font-size: 16px;"># -*- coding: cp936 -*-import urllibimport os print 'Download data......'url = 'http://cn.bing.com'urlFile = urllib.urlopen(url)data = urlFile.read()
-
Python实现豆瓣图片下载的方法
本文实例讲述了Python实现豆瓣图片下载的方法.分享给大家供大家参考.具体分析如下: 1 用 tk 封装一下 2 用户可以自己输入图片url download_douban_album # -*-coding:UTF-8 -*- import re import urllib def count_percent(a, b, c): per = 100.0 * a * b / c if per > 100: per = 100 print '%.2f%%' % per def get_url()
-
python实现下载指定网址所有图片的方法
本文实例讲述了python实现下载指定网址所有图片的方法.分享给大家供大家参考.具体实现方法如下: #coding=utf-8 #download pictures of the url #useage: python downpicture.py www.baidu.com import os import sys from html.parser import HTMLParser from urllib.request import urlopen from urllib.parse im
-
python实现爬虫下载美女图片
本次爬取的贴吧是百度的美女吧,给广大男同胞们一些激励 在爬取之前需要在浏览器先登录百度贴吧的帐号,各位也可以在代码中使用post提交或者加入cookie 爬行地址:http://tieba.baidu.com/f?kw=%E7%BE%8E%E5%A5%B3&ie=utf-8&pn=0 #-*- coding:utf-8 -*- import urllib2 import re import requests from lxml import etree 这些是要导入的库,代码并没有使用正则
-
Python3实现Web网页图片下载
先来介绍一些python web编程基础知识 1. GET与POST区别 1)POST是被设计用来向web服务器上放东西的,而GET是被设计用来从服务器取东西的,GET也能够向服务器传送较少的数据,而Get之所以也能传送数据,只是用来设计告诉服务器,你到底需要什么样的数据.POST的信息作为HTTP 请求的内容,而GET是在HTTP 头部传输的: 2)POST与GET在HTTP 中传送的方式不同,GET的参数是在HTTP 的头部传送的,而Post的数据则是在HTTP 请求的内容里传送; 3)PO
-
Python实现批量下载图片的方法
本文实例讲述了Python实现批量下载图片的方法.分享给大家供大家参考.具体实现方法如下: #!/usr/bin/env python #-*-coding:utf-8-*-' #Filename:download_file.py import os,sys import re import urllib import urllib2 base_url = 'xxx' array_url = list() pic_url = list() inner_url = list() def get_a
-
Python实现从订阅源下载图片的方法
本文实例讲述了Python实现从订阅源下载图片的方法.分享给大家供大家参考.具体如下: 这段代码是基于python 3.4实现的,和python2.X 比起来有了好多差别啊. 这是一个练习,数据源来自网易订阅.代码如下: 复制代码 代码如下: __author__ = 'Saint' import os import urllib.request import json from html.parser import HTMLParser # 从获取的网页内容筛选图片的内容 class MyHt
-
python批量下载图片的三种方法
有三种方法,一是用微软提供的扩展库win32com来操作IE,二是用selenium的webdriver,三是用python自带的HTMLParser解析.win32com可以获得类似js里面的document对象,但貌似是只读的(文档都没找到).selenium则提供了Chrome,IE,FireFox等的支持,每种浏览器都有execute_script和find_element_by_xx方法,可以方便的执行js脚本(包括修改元素)和读取html里面的元素.不足是selenium只提供对py
-
Python下载指定页面上图片的方法
本文实例讲述了Python下载指定页面上图片的方法.分享给大家供大家参考,具体如下: #!/usr/bin/python #coding:utf8 import re import urllib def getHtml(url): page = urllib.urlopen(url) html = page.read() return html def getImg(html): reg = r'src="(.*?\.jpg)" ' imgre = re.compile(reg) im
随机推荐
- asp文本框换行显示代码
- 批处理生成几乎任何字符,包括Tab
- 原生JS实现简单放大镜效果
- PHP Mysql编程之高级技巧
- Android加载图片内存溢出问题解决方法
- JS读取XML文件数据并以table形式显示数据的方法(兼容IE与火狐)
- python实现人人网登录示例分享
- java实现单链表、双向链表
- 微信小程序之页面跳转和参数传递的实现
- javascript SpiderMonkey中的函数序列化如何进行
- 详解Linux如何查看当前占用CPU或内存最多的几个进程
- SQLSERVER的非聚集索引结构深度理解
- jQuery使用siblings获取某元素所有同辈(兄弟姐妹)元素用法示例
- 一个进程间通讯同步的C#框架引荐
- Java 常量池的实例详解
- .NET的深复制方法(以C#语言为例)
- Bootstrap警告(Alerts)的实现方法
- php 上传文件类型判断函数(避免上传漏洞 )
- 读取android根目录下的文件或文件夹实例
- 理性选购虚机 为企业电子商务开启安全通道