Python基础第三方模块requests openpyxl

目录
  • 一、第三方模块的下载与使用
    • 1、什么是第三方模块
    • 2、如何安装第三方模块
      • 方式一:pip工具
      • 方式二:pycharm中下载
    • 3、注意事项
      • 1、报错并有警告信息
      • 2、报错,提示关键字
      • 3、报错,无关键字
      • 4、下载速度慢
  • 二、网络爬虫之requests模块
    • 1、简介
    • 2、使用方法
      • 1.关键词:get( )
      • 2.关键词:encoding
      • 3.关键词:content
      • 4.关键词:text
      • 5.关键词:url
      • 6.关键词:status_code
  • 三、网络爬虫实战
    • 1、爬取链家网站房屋信息
  • 四、openpyxl模块
    • 1、简介
    • 2、创建文件相关
      • 2、1.创建excel文件
      • 2、2.创建工作簿
      • 2、3.修改工作簿名称
      • 2、4.修改工作簿颜色
      • 2、5.查看文件所有工作簿
    • 3、写入内容相关
      • 3、1.写入/修改内容
      • 3、2.一次写入多个数据
    • 4、读取内容相关
      • 4、1.访问多个单元格
      • 4、2.获取单元格值
    • 5、保存文件
    • 6、打开文件
      • 6、1.读取工作簿数据

一、第三方模块的下载与使用

1、什么是第三方模块

  • 第三方模块是指别人编写的模块
  • 第三方模块一般功能都比较强大

2、如何安装第三方模块

方式一:pip工具

安装方式:

1、打开python解释器的安装目录,找到Scipts目录,该目录下会有pip.exe的程序,这个程序就是用来安装第三方模块的

2、将python版本对应的Scipts文件目录添加至系统环境变量

3、打开cmd命令提示符窗口,在cmd命令窗口中运行下载第三方模块的句式

下载第三方模块的句式
	pip install 模块名
下载第三方模块临时切换仓库
	pip install 模块名 -i 仓库地址
下载第三方模块指定版本(不指定默认是最新版)
	pip install 模块名==版本号 -i 仓库地址

注意事项:

我们的电脑中可能安装了多个版本的python解释器,每个版本中都有pip工具,在我们使用pip安装模块时,需要下载在我们使用的版本中的pip工具中,否则下载的模块将无法运行

方式二:pycharm中下载

安装方式:

1、在pycharm中点击左上角File

2、在下方目录中找到Settings

3、找到Project,打开python Interpreter

4、点击'+'号,在上方窗口内输入想要下载的模块

5、点击Install Package,等待即可下载完成

注意事项:

1、在安装窗口右侧找到Specify versin 可选择需要下载模块版本号

2、Manage Repositories可配置仓库地址

3、注意事项

1、报错并有警告信息

WARNING: You are using pip version 20.2.1;

  • 原因在于pip版本过低 只需要拷贝后面的命令执行更 新操作即可

d:\python38\python.exe -m pip install --upgrade pip

  • 更新完成后再次执行下载第三方模块的命令即可

2、报错,提示关键字

Timeout

  • 提示该关键字说明当前计算机网络不稳定,只需更换网络或等待网络稳定后下载即可

3、报错,无关键字

面向百度搜索

  • 只需拷贝报错信息到百度搜索即可
  • 通常都是需要用户提前准备好一些下载环境才可以顺利下载

4、下载速度慢

pip的默认下载地址都是国外的,我们只需要切换下载地址即可

  • 关于切换下载地址的方式在上面已经说明
  • 常用下载地址

清华大学 :
    https://pypi.tuna.tsinghua.edu.cn/simple/

阿里云:
    http://mirrors.aliyun.com/pypi/simple/

中国科学技术大学 :
    http://pypi.mirrors.ustc.edu.cn/simple/

华中科技大学:
    http://pypi.hustunique.com/

豆瓣源:
    http://pypi.douban.com/simple/

腾讯源:
    http://mirrors.cloud.tencent.com/pypi/simple

华为镜像源:
    https://repo.huaweicloud.com/repository/pypi/simple/

二、网络爬虫之requests模块

1、简介

  • requests模块是一个第三方模块,需要在额外进行安装
  • 它是一个用于网络请求的模块,主要用来向浏览器发送请求

2、使用方法

导入模块:

import requests

1.关键词:get( )

作用:用于向浏览器发送请求

代码用法:

url = "https://www.baidu.com"
res = requests.get(url)

2.关键词:encoding

作用:指定编码格式,针对一些古老的网站,在获取网页信息的时候,不指定编码格式的话可能会出现乱码。不指定的情况下默认使用系统自带的编码环境

代码用法:

res = encoding = 'utf8'

3.关键词:content

作用:返回的是一个原生字符串,是bytes类型

代码用法:

print(res.content)
# 返回的是一个原生字符串,是bytes类型

4.关键词:text

作用:获取字符串类型的网页数据(默认按照utf8)

代码用法:

print(res.text)
# 获取字符串类型的网页数据(默认按照utf8)

5.关键词:url

作用:打印请求

代码用法:

print(res.url)

6.关键词:status_code

作用:打印状态码

代码用法:

print(res.staus_code)

三、网络爬虫实战

1、爬取链家网站房屋信息

import re
import requests
from openpyxl import Workbook
url = 'https://sh.lianjia.com/ershoufang/pg1/'
for i in range(1, 101):
    url = f"https://sh.lianjia.com/ershoufang/pg{i}/"
    print(url)
    res = requests.get(url)
    url_data = res.text
    home_biaoqian = re.findall(
        """data-is_focus="" data-sl="">(.*?)</a>""",
        url_data)
    home_xiaoqu_name = re.findall(
        """<a href="https:.*?" rel="external nofollow"  target="_blank" data-log_index=".*?" data-el=".*?">(.*?)</a>""",
        url_data)
    home_xiaoqu_dir = re.findall("""<a href="https://sh.lianjia.com/ershoufang/.*?/" rel="external nofollow"  target="_blank">(.*?)</a>""",
                                 url_data)
    home_jutixinxi = re.findall("""<div class="houseInfo"><span class="houseIcon"></span>(.*?)</div>""", url_data)
    home_guanzhudu = re.findall("""<div class="followInfo"><span class="starIcon"></span>(.*?)</div>""", url_data)
    home_zongjia = re.findall("""<span class="">(.*?)</span>""", url_data)
    home_danjia = re.findall("""<span>(.*?)</span>""", url_data)
    home_data = zip(home_xiaoqu_name, home_xiaoqu_dir, home_biaoqian, home_jutixinxi, home_guanzhudu, home_zongjia,
                    home_danjia)
    with open(r'sh_.txt', 'w', encoding='utf8') as f:
        for i in home_data:
            f.write('''
                小区名称:%s
                小区地址:%s
                小区标签:%s
                详情:%s
                关注度:%s
                总价:%s
                单价:%s\r
                '''%i)

四、openpyxl模块

1、简介

  • openpyxl模块属于第三方模块,是一个在 python 中能够处理 excel 文件的模块,还有比较出名的是xlrd、xlwt 分别控制excel文件的读写,这俩个能够兼容所有版本的文件。openpyxl 针对 excel 2003版本之前的兼容性可能不好 但是功能更加强大。

注意事项:

excel文件的版本及后缀

2003版本之前 excel的文件后缀是xls

2003版本之后 excel的文件后缀是xlsx、csv

2、创建文件相关

2、1.创建excel文件

关键词:workbook

作用:

  • 使用 openpyxl 创建文件。只需导入Workbook类

代码用法:

导入模块:
	form openpyxl import workbook
代码用法:
	from openpyxl import Workbook
    wb = Workbook
	 # 一个 excel 文件创建成功

2、2.创建工作簿

关键词:cerate_sheet( )

作用:

  • 使用 openpyxl 创可以创建自定义名称的工作簿。括号里的参数是工作簿名称,还有一个参数是工作簿的位置,也可以不写建文件。只需导入Workbook类
  • 可以创建多个工作簿,并且可按照顺序排列

代码用法:

导入模块:
	form openpyxl import workbook
代码用法:
	from openpyxl import Workbook
	wb = Workbook()
	ws1 = wb.cerate_sheet('工作簿名称', 0)

sheet 是自动生成的

2、3.修改工作簿名称

关键词:title

作用:

  • 可以更改工作簿名称
  • 通过待修改名称工作簿‘点’的方式在后方赋予新的名称

代码用法:

导入模块:
	form openpyxl import workbook
代码用法:
	from openpyxl import Workbook
	wb = Workbook()
	ws1 = wb.cerate_sheet('用户信息表', 0)
	ws1.title = 'user_infor'

2、4.修改工作簿颜色

关键词:sheet_properties.tabColor

作用:

  • 用来给工作簿背景修改颜色,需要用到RGB色域

代码用法:

导入模块:
	from openpyxl import Workbook
    wb = Workbook()
    ws1 = wb.create_sheet('用户信息表', 0)
    ws1.sheet_properties.tabColor = 'FF6666'
    # 将标题背景改为指定RRGGBB颜色代码

2、5.查看文件所有工作簿

关键词:sheetname

作用:

  • 查看exexl文件下所有的工作簿,返回的是一个列表

代码用法:

导入模块:
	from openpyxl import Workbook
代码用法:
	wb = Workbook()
	ws1 = wb.create_sheet('uese_zhangzhang')
	ws2 = wb.create_sheet('user_kangkang')
	print(wb.sheetname)
	# ['user_zhangzhang', 'user_zhangzhang']

3、写入内容相关

3、1.写入/修改内容

关键词:ws[]

作用:

  • 可以通过工作簿'点'的方式,在后方中括号内填写内容的位置,来修改内容

代码用法:

导入模块:
	from openpyxl import Workbook
代码用法:
	wb = Workbook()
	ws1 = wb.create_sheet('uese_zhangzhang')
	ws1['A1'] = 'kangkang'
	# ws1['A1'] 代表的是该表中的 A1 位置,我们可以将数据直接赋值给它

关键词:cell( )

作用:

  • 可以通过工作簿'点'的方式,在后方参数内填写内容的位置,来修改内容
  • row:行
  • colum:列
  • value:值(对应位置的数据)

代码用法:

导入模块:
	from openpyxl import Workbook
代码用法:
	wb = Workbook()
	ws1 = wb.create_sheet('uese_zhangzhang')
	ws1.cell(row = 1, column= 1, value = 'kangkang')
	# 在第一行,第一列,填入数值'kangkang'

3、2.一次写入多个数据

关键词:append()

作用:

  • 可以一次性写入多个数据值,通过行的方式写入,在关键词后方参数内将数据值以列表的形式写入

代码用法:

导入模块:
	from openpyxl import Workbook
代码用法:
	wb = Workbook()
	ws = wb.cerate_sheet('user_name', 0)
	ws.append(['序号', '姓名', '性别', '年龄'])
	ws.append(['1', 'kangkang', '男', '18'])

4、读取内容相关

4、1.访问多个单元格

用法:直接使用切片操作的方式

代码用法:

x = ws['A1':'C2']
x1 = ws['C']
x2 = ws['C:D']
x3 = ws[10]
x4 = ws[5:10]

4、2.获取单元格值

关键词:values

作用:

  • 使用for循环的方式,可以一次获取整行文本数据值

代码用法:

导入模块:
	from openpyxl import Workbook
代码用法:
	wb = Wordbook()
	ws1 = wb.create_sheet('nser_name', 0)
	ws1.append(['name', 'age', 'hobby'])
	ws1.append(['kangkang', 18, 'read'])
	for i in ws1.vallue:
        print(i)

5、保存文件

  • 当我们编辑完文件后,就需要保存文件,同时赋予文件的名称

关键词:save( )

作用:

  • 在关键词后方参数内填入文件保存的地址,同时赋予文件名

代码用法:

wb = Workbook()
wb.save('user_infor.xlsx')
# balances.xlsx 是保存的路径,也就是文件名。
# 编辑完要保存才行。

6、打开文件

前面说的是我们如何创建文件,编辑创建后的文件,对创建的文件进行编辑。

下面所说的是我们如何打开现有的文件,并进行编辑

load_workbook

模块导入:

from openpyxl import load_workbook

6、1.读取工作簿数据

方式一:

from openpyxl import load_workbook
wb = load_workbook('ex_a.xlsx', read_only=True, data_only=True)
ws = wb['用户信息表']  # 拿到工作薄对象
print(ws['A1'].value)  # 取出工作薄对象中 A1 位置的值

方式一:

from openpyxl import load_workbook
wb = load_workbook('ex_a.xlsx', read_only=True, data_only=True)
ws = wb['用户信息表']
print(ws.cell(row=2, column=1).value)  # 通过行与列的形式来取值

方式三:(逐行读取)

方式三(逐行读取)
from openpyxl import load_workbook
wb = load_workbook('ex_a.xlsx', read_only=True, data_only=True)
ws = wb['用户信息表']
for row in ws.rows:  # 获取每一行的数据
	for data in row:  # 获取每一行中单元格的数据
		print(data.value)  # 打印单元格的值

以上就是Python基础第三方模块requests openpyxl的详细内容,更多关于Python模块requests openpyxl的资料请关注我们其它相关文章!

(0)

相关推荐

  • 详解Python操作Excel之openpyxl

    目录 Python操作Excel之openpyxl 前提 创建 读取 总结 Python操作Excel之openpyxl openpyxl是一个Python库,用来读写Excel2010 xlsx/xlsm/xltx/xltm类型文件. openpyxl不能操作早期的xls格式的Excel文件,可以使用xlwings等其他库. openpyxl是一个非标准的库,需要自行安装:pip install openpyxl 前提 既然要操作Excel,那么前提我们对Excel要有一个基本的了解,比如:

  • Python requests.post()方法中data和json参数的使用方法

    目录 json和dict requests.post() post请求中json和data的区别 json和dict python中的dict类型要转换为json格式的数据需要用到json库: import json <json> = json.dumps(<dict>) <dict> = json.loads(<json>) 需要注意的是: python中并没有json类型这一说法,通过json.dumps(<dict>)转换的字典对象,最后得

  • Python openpyxl模块学习之轻松玩转Excel

    目录 前言 openpyxl 安装 打开/创建工作簿 访问工作表 获取单元格信息 修改工作表 修改样式 前言 当你需要每天对 Excel 做大量重复的操作,如果只靠人工来做既浪费时间,又十分枯燥,好在 Python 为我们提供了许多操作 Excel 的模块,能够让我们从繁琐的工作中腾出双手. 今天就和大家分享一个快速处理 Excel 的模块 openpyxl,它的功能相对与其他模块更为齐全,足够应对日常出现的问题. openpyxl 安装 直接在命令提示符中输入. pip install ope

  • python requests.post请求404问题及解决方法

    目录 问题场景 问题分析 postman测试 问题解决 结论 问题场景 有时候,在编写一段http接口请求程序时,发现代码中的header头和请求体中都是原网页中一样,但是,在实际请求时,接口却返回404,代码如下 header = { # ':authority': 'm.ctrip.com', # ':method': 'POST', # ':path': '/restapi/soa2/20405/getPCSightList', # ':scheme': 'https', 'accept'

  • python中Requests发送json格式的post请求方法

    目录 前言 1.普通string类型 2.string内是字典的 3.元组(嵌套列表或者) 4.字典 5.json 6.传入非嵌套元组或列表 7.以post(url,json=data)请求 前言 问题: 做requests请求时遇到如下报错: {“code”:“500”,“message”:"JSON parse error: Cannot construct instance of com.bang.erpapplication.domain.User (although at least

  • Python如何实现Excel的最合适列宽(openpyxl)

    目录 Excel的最合适列宽(openpyxl) 这是最简单的实现 Python写Excel列宽,行高的一些方法 使用第三方库 xlsxwriter,结果文件格式为xlsx 使用第三方库 xlwt,结果文件格式为xls Excel的最合适列宽(openpyxl) Python的Pandas模块是处理Excel的利器,尤其是加工保存Excel非常方便,但是唯独想让导出的Excel自动调整列宽或者行高,确实做不到啊,尤其是加工后还需要使用者自己调整列宽,非常不便. 所以必须openpyxl模块助力.

  • Python基础第三方模块requests openpyxl

    目录 一.第三方模块的下载与使用 1.什么是第三方模块 2.如何安装第三方模块 方式一:pip工具 方式二:pycharm中下载 3.注意事项 1.报错并有警告信息 2.报错,提示关键字 3.报错,无关键字 4.下载速度慢 二.网络爬虫之requests模块 1.简介 2.使用方法 1.关键词:get( ) 2.关键词:encoding 3.关键词:content 4.关键词:text 5.关键词:url 6.关键词:status_code 三.网络爬虫实战 1.爬取链家网站房屋信息 四.ope

  • Python基础之模块详解

    目录 一.模块 1.模块的四种形式 2.为什么要用模块? 二.如何用模块 1.import 模块名 导入重命名:smt变量指向span模块的名称空间 导入多个模块 2.from 模块名 import 具体的函数 rom … import * 语句:导入文件内所有的功能: 3.循环导入 4.dir() 函数 三.模块搜索路径 1.导入模块时查找模块的顺序 1.先从内存中已经导入的模块中寻找 2.内置的模块 3.环境变量sys.path中找(强调:sys.path的第一个值是当前执行文件的所在的文件

  • python 爬虫请求模块requests详解

    requests 相比urllib,第三方库requests更加简单人性化,是爬虫工作中常用的库 requests安装 初级爬虫的开始主要是使用requests模块 安装requests模块: Windows系统: cmd中: pip install requests mac系统中: 终端中: pip3 install requests requests库的基本使用 import requests url = 'https://www.csdn.net/' reponse = requests.

  • Python利用第三方模块实现压缩css文件

    目录 csscompressor 库使用 cssmin 库的用法 rcssmin 库的用法 总结 csscompressor 库使用 在 Python 中可以使用多种方法来压缩 CSS 文件.其中一种流行的方法是使用 csscompressor 库,这个库可以帮助你压缩 CSS 代码,减小文件大小.在控制台中运行 pip install csscompressor 来安装这个库. 后续的核心是使用 csscompressor.compress() 函数来压缩 CSS 文件. 接下来演示一下最基础

  • 详解Python基础random模块随机数的生成

    随机数参与的应用场景大家一定不会陌生,比如密码加盐时会在原密码上关联一串随机数,蒙特卡洛算法会通过随机数采样等等.Python内置的random模块提供了生成随机数的方法,使用这些方法时需要导入random模块. import random 下面介绍下Python内置的random模块的几种生成随机数的方法. 1.random.random() 随机生成 0 到 1 之间的浮点数[0.0, 1.0) . print("random: ", random.random()) #rando

  • Python基础之模块相关知识总结

    一.什么是模块 容器 -> 数据的封装 函数 -> 语句的封装 类 -> 方法和属性的封装 模块 -> 模块就是程序,模块就是.py文件 导入hello模块,且使用hello命名空间的hi()函数 (1)hello.py模块的创建 注意模块与调用的程序要在同一个文件夹下面 import的时候直接写名字就行了,不用加上.py,eg:hello.py,hello就是模块名 (2)执行 命名空间 在Python中,每个模块都会维护一个独立的命名空间,我们应该将模块名加上,才能够正常使用模

  • Python中第三方库Requests库的高级用法详解

    一.Requests库的安装 利用 pip 安装,如果你安装了pip包(一款Python包管理工具,不知道可以百度哟),或者集成环境,比如Python(x,y)或者anaconda的话,就可以直接使用pip安装Python的库. $ pip install requests 安装完成之后,下面来看一下基本的方法: #get请求方法 >>> r = requests.get('https://api.github.com/user', auth=('user', 'pass')) #打印g

  • python基础之模块的导入

    import导入模块 import time #导入的时模块中的所有内容 print(time.ctime()) #调用模块中的函数 # import 到首次导入模块的时候,会发生如下3步操作 # 1.打开模块文件 # 2.执行模块对应的文件 将执行过程中产生的名字都丢到模块的名称空间 # 3.在程序中会有一个模块[可以取别名的]的名称只想模块的名称空间区 # 4.建立模块时,不要与模块名相同,否则系统会直接就近在文件中查找,而不是导入真正的模块 # 引用格式:模块名:函数名 可以防止不同模块中

  • 用python的requests第三方模块抓取王者荣耀所有英雄的皮肤实例

    本文使用python的第三方模块requests爬取王者荣耀所有英雄的图片,并将图片按每个英雄为一个目录存入文件夹中,方便用作桌面壁纸 下面时具体的代码,已通过python3.6测试,可以成功运行: 对于所要爬取的网页连接可以通过王者荣耀官网找到, # -*- coding: utf-8 -*- """ Created on Wed Dec 13 13:49:52 2017 @author:KillerTwo """ import request

  • Python如何安装第三方模块

    Python中有哪几种方法安装第三方模块,安装Python第三方模块的方法有很多,这里介绍三种方法安装第三方模块. [方法一]: 通过setuptools来安装python模块 首先下载 http://peak.telecommunity.com/dist/ez_setup.py NOTE: 最好下载个setuptools,本人是15.2版本,里面包含了ez_setup 运行 python ez_setup.py D:\work\installation\setuptools-15.2\setu

随机推荐