python requests模块的使用示例

为什么使用requests:

  • 支持使用Cookie保持会话
  • 支持文件上传
  • 支持自动确定响应内容的编码
  • 对用户来说比较人性化

模拟get请求:

获取token

# 使用微信公众平台举例
get_param_dict={
 "grant_type":"**************",
 "appid":"**************",
 "secret":"**************",
}
response = requests.get(url='https://api.weixin.qq.com/cgi-bin/token', # url地址
      params=get_param_dict) # 参数
print(response.content.decode('utf-8'))

模拟请求头部信息

注:因为requests请求头是以python,requests发起的,所以大部分接口都会需要手动添加头部信息

# get 模拟请求头部信息,(当你发现数据不对时,就模拟)
# 以百度举例
get_param_dict ={
 "wd":"newdream"
}
# 添加头部信息字典(可以使用抓包抓取到头部信息)
header_info_dict = {
 "User-Agent":"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36",
 "Accpet":"text/plain, */*; q=0.01"
}
response = requests.get(url = 'https://www.baidu.com/s',
      params=get_param_dict,headers=header_info_dict)
print(response.content.decode('utf-8'))

模拟post请求

import requests,json
# requests模拟发送post请求
# 使用微信公众平台举例
url_param_doct = {"access_token": "43_XcK_1rvR8VPgicGGzq7Vp2QrGx30Kwhy9SSShoVTQs11G_jP9aqhy2bwRQFuG2hYzkwVjphJFfPj8WYQR8vgfu5Xej7KaZBiyPDJ9sYoCKte78sqgtBdCf6N5S8QosNXBOFSEJnzLMbxJwCOTWAgAAANQU"}
post_param_data = {
 "tag" : {  "name" : "我是新标签" }
}
response = requests.post(url='https://api.weixin.qq.com/cgi-bin/tags/create',
       params=url_param_doct,
       # json=post_param_data # 可以使用json
       data=json.dumps(post_param_data) # 也可以使用data,但是data要求是字符串,需要使用json模块dumps转化
       )
print(response.content.decode('utf-8'))

requests上传文件

import requests,os
# post上传文件
current_path = os.path.dirname(__file__) # os模块定位当前路径
excel_path = os.path.join(current_path,'..','data','j.xlsx') # join拼接
excel_file = {'file':open(excel_path,'rb')} # 做成字典,open打开文件 rb:只读二进制
response = requests.post(url='https://2.python-requests.org/', # requests官方实例文档地址
       files=excel_file) # files传文件
print( response.content.decode('utf-8') )

requests设置代理

import requests
# 设置代理:为什么设置代理?
# 爬虫类项目,有检测机制
# 防止公司系统有防灌水功能
# 需要翻墙做接口的时候
proxy_server = {'http':'http://127.0.0.1:8888',
    'https':'http://127.0.0.1:8888'} # 做一个字典
proxy_user_pass = {
 'https':'http://uesrname:password@127.0.0.1:8888' # 需要用户跟密码使用这个
}
response = requests.get(url= 'https://baidu.com',
      proxies=proxy_server) # proxies设置代理关键字
print(response.status_code)

time模块设置请求超时

如果一个请求很久没有结果,就会让整个项目的效率变得非常低,这个时候我们就需要对请求进行强制要求

让他必须在特定的时间内返回结果,否则就报错。

# 设置请求超时
import requests
import time
print(time.time()) # 时间戳
response = requests.get(url='https://www.baidu.com',timeout=3) # timeout=3: 请求如果在规定时间之内(3秒钟内)没有得到响应,就会抛出超时错误
print(time.time())

retrying模块设置刷新

使用超时参数能够加快我们整体的请求速度,但是在正常的网页浏览过成功,如果发生速度很慢的情况,我们会做的选择是刷新页面

retrying模块就可以帮助我们解决。使用retrying模块提供的retry模块

通过装饰器的方式使用,让被装饰的函数反复执行retry中可以传入参数stop_max_attempt_number,让函数报错后继续重新执行

达到最大执行次数的上限,如果每次都报错,整个函数报错,如果中间有一个成功,程序继续往后执行。

import requests
from retrying import retry

# 如果函数连续调用三次都报错,才会报错,如果三次之中有一次成功,就成功
@retry(stop_max_attempt_number=3)
def get_response(url):
 response = requests.get(url, timeout=2)
 return response
retrying_requests = get_response("https://www.baidu.com")
print(retrying_requests.content.decode())

cookie设置

好处:能够访问登录后的页面

坏处:一套cookie往往对应的是一个用户的信息,请求太频繁有更大的可能性被对方识别为爬虫
如何解决 ?使用多个账号

# 使用requests提供的session模块
import requests
# 构造formdata表单数据,填写自己的账号和密码
post_data = {
 "username": "xxxxx",
 "password": "xxxxx"
}
# session的使用: 在请求之前创建session对象
session = requests.Session()
# 后续的请求都由session来发起,因为session中保存了用户的登陆信息
session.post(url="https://www.baidu.com", data=post_data)
response = session.get("https://www.baidu.com")
# 使用session请求登陆后的界面
print(response.content.decode())

处理证书认证错误

import requests
# 方式一:不验证证书,报警告,返回200
requests.packages.urllib3.disable_warnings()# 直接解决爆红警告

# 方式二不验证证书,报警告,返回200 ,后面拼接verify=False,加这个控制台报警的话,就在加上方式一
response = requests.get('https://www.12306.cn',verify=False)
print(response.content.decode('utf-8'))

# 方式三:安装pyopenssl 安装之后就不会报错# pip3 install -U requests[security]
response = requests.get('https://www.12306.cn')
print(response.content.decode('utf-8'))

# 方式四: 加上证书 公司内部 问开发要xxx.crt文件 ,最稳妥
response = requests.get('https://www.12306.cn',cert=('/path/server.crt', '/path/key'))

requests+jsonpath解析数据

hosts = 'https://api.weixin.qq.com' # 主机地址
# 获取token
get_param_dict = {
 "grant_type":"**********",
 "appid":"*************",
 "secret":"***************"
}
response = requests.get('%s/cgi-bin/token'%hosts,params=get_param_dict)
json_obj = response.json()
 # json数据解析:从一个json体中取出需要的数据,就叫json数据解析
token_id = jsonpath.jsonpath(json_obj,'$.access_token')[0] # 接口依赖,接口关联
print(token_id)

以上就是python requests模块的使用的详细内容,更多关于python requests模块的使用的资料请关注我们其它相关文章!

(0)

相关推荐

  • Python中re模块的常用方法总结

    前言 正则表达式作为计算机科学的一个概念,通常被用来检索.替换那些符合某个规则的文本.正则表达式是对字符串操作的一种逻辑公式,用事先定义好的规则字符串对字符串进行过滤逻辑处理. re模块总结,正则表达式.在网络爬虫中对于数据定位,学习regex也很有必要 常用方法 re.compile() 将指定的正则表达式模式编译为正则表达式对象,可用于匹配和搜索 re.match() 该方法用于匹配字符串开头的模式 re.serach() 该方法用于匹配出现在字符串中任意位置的模式 re.findall()

  • python urllib.request模块的使用详解

    python的urllib模块提供了一系列操作url的功能,可以让我们通过url打开任意资源.其中比较常用的就是request模块,本篇主要介绍requset模块. urllib子模块 urllib.request 打开或请求url urllib.error 捕获处理请求时产生的异常 urllib.parse 解析url urllib.robotparser 用于解析robots.txt文件 robots.txt是一种存放于网站根目录下文本文件,用来告诉网络爬虫服务器上的那些文件可以被查看.又被

  • python os模块和fnmatch模块的使用介绍

    一.先介绍一下os模块 import os   print(os.getcwd()) # E:\python\test\python_models # 获取当前的目录     print(os.listdir(".")) # ['oop.py', 'python_argparse.py', 'python_click.py', 'python_os.py', 'python_re.py', 'python_requests.py', 'xx.py', '__init__.py'] #

  • python glom模块的使用简介

    工欲善其事,必先利其器!我们想要更轻松更有效率地开发,必须学会一些"高级"技能.前不久看到一位 Python 高僧的代码,其中使用了一个短小精悍的模块,我认为还蛮有用的,今天分享给大家. 这个模块就叫 glom ,是 Python 处理数据的一个小模块,它具有如下特点: 嵌套结构并基于路径访问 使用轻量级的Pythonic规范进行声明性数据转换 可读.有意义的错误信息 内置数据探测和调试功能 看起来比较抽象,对不对?下面我们用实例来给大家演示一下. 安装 作为 Python 内置模块,

  • Python3 json模块之编码解码方法讲解

    JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,它基于ECMAScript的一个子集. JSON采用完全独立于语言的文本格式,这些特性使JSON成为理想的数据交换格式,易于人阅读和编写,同时也易于机器解析和生成,在接口数据开发和传输中非常常用. Python3中我们利用内置模块json解码和编码JSON对象.json模块提供了四个功能: dumps.dump.loads.load dumps 把数据类型转换成字符串  dump  把数据类型转换成字符串

  • Python实现学生管理系统的代码(JSON模块)

    构思 学生管理系统 应该包含老师注册登录 管理学生信息(增删改查)还有数据持久化 因为数据存入JSON文件 增删改查都需要读取和修改文件 所以需要一个读写文件的方法文件 file_manager 密码加密可以用到哈希模块文件 tools 老师和学生的类文件 model 程序入口(主页)文件index 核心增删改查文件 student_manager file_manager.py """ Project: ClassStudent Creator: 猫猫 Create tim

  • Python模块介绍与使用详细讲解

    模块的相关概念 1. 什么是模块 模块就好比是工具包,要想使用这个工具包中的工具(就好比函数),就需要导入这个模块 模块的英文名叫: modules,一个模块中可以包含N个函数,也可以包含类等等. 在Python中一个扩展名为.py的文件就是一个模块. 2. 使用模块的好处 方便其他程序和脚本的导入并使用 避免函数名和变量的冲突 提高代码的可维护性 提高代码的可重用性 模块的使用 1. 自定义模块 创建一个.py文件,名称尽量不要与Python自带的标准模块名称相同,需要见名知意. a) 方法一

  • python tkinter模块的简单使用

    由于一些小原因,被迫开始了tkinter一次实战演练.在此做一些记录,总结以及给自己留一些轮子哈哈哈哈哈哈 tkinter 是 Python 的一个GUI库,本次实战完全使用tkinter,不牵扯任何其他第三方库的使用. 1.任务要求 画一个具有上传病患信息以及图片功能的用户界面 2.简单设计 由于时间紧迫且只要求可视化,背后没有必要太过精细,所以简单设计思路是,利用下拉列表实现病患信息的填写,用text显示选择图片的路径. 表面上的组件包括:两个Button:选择目录 SELECT THE D

  • python 绘图模块matplotlib的使用简介

    上周对线上某几个磁盘进行了fio硬盘性能测试,测试完成之后的结果需要绘制成图像展示出来.我在官网上查找了一下fio自带的命令fio_generate_plot和fio2gnuplot工具的用法,找到了图像的绘制方法,在某一个单一的场景下,确实可以使用这两个工具来进行硬盘性能图像绘制,但是问题是,如果要对比多个场景下绘制出来的图像的差异,fio自带的绘图工具实现起来就有些困难了,但是确实也能实现.例如下图: 如图所示为磁盘iodepth不变,numjobs在(1,8,16)三种不同的场景下绘制出来

  • python 中os模块os.path.exists()的用法说明

    os即operating system(操作系统),Python 的 os 模块封装了常见的文件和目录操作. os.path模块主要用于文件的属性获取,exists是"存在"的意思,所以顾名思义,os.path.exists()就是判断括号里的文件是否存在的意思,括号内的可以是文件路径. 举个栗子: user.py为存在于当前目录的一个文件 输入代码: import os path = os.path.exists('user.py') print(path) 输出结果: True P

  • python使用timeit时间模块

    1. timeit.timeit(stmt='pass', setup='pass', timer=<default timer>, number=default_number) timeit() 函数有四个参数,每个参数都是关键字参数,都有默认值. stmt:传入需要测试时间的代码,可以直接传入代码表达式或单个变量,也可以传入函数.传入函数时要在函数名后面加上小括号,让函数执行,如 stmt = 'func()' . setup:传入 stmt 的运行环境,如 stmt 中使用到的参数.变量

随机推荐