Python爬虫:url中带字典列表参数的编码转换方法
平时见到的url参数都是key-value, 一般vlaue都是字符串类型的
如果有幸和我一样遇到字典,列表等参数,那么就幸运了
python2代码
import json from urllib import urlencode # 1. 直接将url编码 params = { "name": "Tom", "hobby": ["ball", "swimming"], "books": [{"name": "语文", "pages": 20}] } print(urlencode(params)) """ hobby=%5B%27ball%27%2C+%27swimming%27%5D& books=%5B%7B%27name%27%3A+%27%5Cxe8%5Cxaf%5Cxad%5Cxe6%5Cx96%5Cx87%27%2C+%27pages%27%3A+20%7D%5D& name=Tom """ # 2. 先用json序列化字典和列表参数 params = { "name": "Tom", "hobby": json.dumps(["ball", "swimming"]), "books": json.dumps([{"name": "语文", "pages": 20}]) } print(urlencode(params)) """ hobby=%5B%22ball%22%2C+%22swimming%22%5D& books=%5B%7B%22name%22%3A+%22%5Cu8bed%5Cu6587%22%2C+%22pages%22%3A+20%7D%5D& name=Tom """
观察1 和2 序列化出来的url参数不是一样的,如果第一种方式的url不能正常访问,那么就用第二种
相关推荐
-
python实现中文转换url编码的方法
本文实例讲述了python实现中文转换url编码的方法.分享给大家供大家参考,具体如下: 今天要处理百度贴吧的东西.想要做一个关键词的list,每次需要时,直接添加 到list里面就可以了.但是添加到list里面是中文的情况(比如'丽江'),url的地址编码却是'%E4%B8%BD%E6%B1%9F',因此需 要做一个转换.这里我们就用到了模块urllib. >>> import urllib >>> data = '丽江' >>> print dat
-
Python爬虫:将headers请求头字符串转为字典的方法
原生请求头字符串 raw_headers = """Host: open.tool.hexun.com Pragma: no-cache Cache-Control: no-cache User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36 Accept: */* Re
-
python字符串与url编码的转换实例
主要应用的场景 爬虫生成带搜索词语的网址 1.字符串转为url编码 import urllib poet_name = "李白" url_code_name = urllib.quote(poet_name) print url_code_name #输出 #%E6%9D%8E%E7%99%BD 2.url编码转为字符串 import urllib url_code_name = "%E6%9D%8E%E7%99%BD" name = urllib.unquote(
-
Python爬虫:url中带字典列表参数的编码转换方法
平时见到的url参数都是key-value, 一般vlaue都是字符串类型的 如果有幸和我一样遇到字典,列表等参数,那么就幸运了 python2代码 import json from urllib import urlencode # 1. 直接将url编码 params = { "name": "Tom", "hobby": ["ball", "swimming"], "books":
-
解决Python 爬虫URL中存在中文或特殊符号无法请求的问题
这种问题,初学者应该都会遇到,分享给大家做个参考! from urllib.parse import quote import string #解决请求路径中含义中文或特殊字符 url_ = quote(new_url, safe=string.printable); 以上这篇解决Python 爬虫URL中存在中文或特殊符号无法请求的问题就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们.
-
python 获取url中的参数列表实例
Python的urlparse有对url的解析,从而获得url中的参数列表 import urlparse urldata = "http://en.wikipedia.org/w/api.php?action=query&ctitle=FA" result = urlparse.urlparse(urldata) print result print urlparse.parse_qs(result.query) 输出: ParseResult(scheme='http',
-
python爬虫实现中英翻译词典
本文实例为大家分享了python爬虫实现中英翻译词典的具体代码,供大家参考,具体内容如下 通过根据某平台的翻译资源,提取出翻译信息,并展示出来,包括输入,翻译,输出三个过程,主要利用python语言实现(python3.6),抓取信息展示. import urllib.request import urllib.parse import json def en_zh(content): url = 'http://fanyi.baidu.com/v2transapi' head = {} hea
-
python爬虫URL重试机制的实现方法(python2.7以及python3.5)
应用场景: 状态不是200的URL重试多次 代码比较简单还有部分注释 python2.7实现: # -*-coding:utf-8-*- """ ayou """ import requests def url_retry(url,num_retries=3): print("access!") try: request = requests.get(url,timeout=60) #raise_for_status(),如果
-
Python脚本开发中的命令行参数及传参示例详解
目录 sys模块 argparse模块 Python中的正则表达式 正则表达式简介 Re模块 常用的匹配规则 sys模块 在使用python开发脚本的时候,作为一个运维工具,或者是其他工具需要在接受用户参数运行时,这里就可以用到命令行传参的方式,可以给使用者一个比较友好的交互体验. python可以使用 sys 模块中的 sys.argv 命令来获取命令行参数,其中返回的参数是一个列表 在实际开发中,我们一般都使用命令行来执行 python 脚本 使用终端执行python文件的命令:python
-
python 匹配url中是否存在IP地址的方法
因为需要检测一个一个链接中是否包含了IP地址,在这里需要使用到正则表达式 ,python完美的支持了正则表达式,在这里使用re模块来完成,对正则表达式并不是很熟练,每次都是需要用的时候现查一下然后写一下,这里给出来自己的代码以及借鉴别人的匹配模式 #!/usr/bin/env python # -*- coding: utf-8 -*- ''' 功能:对于给定的URL,检测其中是否包含IP ''' import re def ip_exist_two(one_url): compile_rule
-
Python爬虫程序中使用生产者与消费者模式时进程过早退出的问题
之前写爬虫程序的时候,采用生产者和消费者的模式,利用Queue作为生产者进程和消费者进程之间的同步队列. 执行程序时,总是秒退,加了断点也无法中断,加打印也无法输出,我知道肯定是进程退出了,但还是百思不得解,为什么会这么快就退出. 一开始以为是我的进程代码写的有问题,在某个地方崩溃导致程序提前退出,排查了一遍又一遍,并没有发现什么明显的问题,后来走读代码,看到主模块中消费者和生产者进程的启动后,发现了问题,原因是我通过start()方法启动进程后,使用join()的方式有问题.消费者进程必须执行
-
python爬虫urllib中的异常模块处理
目录 urllib中的异常处理 url的组成部分 URLError HTTPError 简介 Urllib.error 模块 异常处理 urllib中的异常处理 在我们写爬虫程序时,若出现url中的错误,那么我们就无法爬取我们想要的内容,对此,我们引入了urllib中的异常处理. url的组成部分 URL由6个部分组成:eg: https://www.baidu.com/s?wd=易烊千玺 协议(http/https) 主机(www.baidu.com) 端口号(80/443) 路径(s) 参数
-
如何从Python的cmd中获得.py文件参数
代码: import sys # 导入系统模块获得cmd的参数 import traceback def TEST(params): print(type(params)) if __name__ == '__main__': try: params = None # 获得传入参数 if len(sys.argv) > 1: params_str = '' for i in range(1, len(sys.argv)): params_str += sys.argv[i] if params_
随机推荐
- javascript 对象入门实例教程
- 反向代理缓存的详细介绍
- IOS中的target action控件的实现
- php array_pop()数组函数将数组最后一个单元弹出(出栈)
- Android 使用viewpager实现无限循环(定时+手动)
- PHP编程 SSO详细介绍及简单实例
- python下实现二叉堆以及堆排序的示例
- 列出指定目录下的所有文件和目录
- C#中时间的几种格式转换方法
- Android列表实现(2)_游标列表案例讲解
- JQuery解析XML数据的几个简单实例
- 求数组最大最小值方法适用于任何数组
- 在IE中为abbr标签加样式
- Java 文件解压缩实现代码
- Android Service服务详细介绍及使用总结
- jquery提取元素里的纯文本不包含span等里的内容
- ES6生成器用法实例分析
- Android通话记录备份实现代码
- 教你在header中隐藏php的版本信息
- struts升级到2.5.2遇到的问题及解决方案(推荐)