Python selenium+cookie实现免密登陆的示例代码

目录
  • 获取cookies:
  • 携带cookies实现免密登陆:

今天爬取airbnb的租房数据时,遇到了登陆问题。自己动手解决了一下。

我们知道,http是无状态的,那么网页如何实现用户登陆注册功能呢?Session和Cookie就是为了满足这种需求出现的技术。

首先介绍一下Session和Cookie的概念。

在Web中Session对象存储特定用户会话所需的属性及配置信息。这样,当用户在应用程序的Web页之间跳转时,存储在Session对象中的变量将不会丢失,而是在整个用户会话中一直存在下去。当用户请求来自应用程序的 Web页时,如果该用户还没有会话,则Web服务器将自动创建一个 Session对象。当会话过期或被放弃后,服务器将终止该会话。

Cookie,有时也用其复数形式 Cookies。类型为“小型文本文件”,是某些网站为了辨别用户身份,进行Session跟踪而储存在用户本地终端上的数据(通常经过加密),由用户客户端计算机暂时或永久保存的信息。

当用户第一次访问某个网页时,服务器会创建一个Session对象,用于存储与该用户会话的属性以及配置信息,并且返回一个带有set-cookie字段的响应头给客户端,客户端浏览器会把cookie保存到本地,下一次访问该网页时,会加上cookie。服务器通过cookie辨认是否有用户的Session。这样就实现了用户的登陆注册功能,但是Session和Cookie的应用远不及此,这里不再赘述。

那么为了实现免密登陆,我们需要做如下几件事情:

获取登陆airbnb时客户端浏览器存储的cookies。

把cookies写入本地。

下次用selenium登陆airbnb时,把cookies带上。

获取cookies:

使用selenium的get_cookies()函数来获取cookies。

但是如何实现登陆呢?总得要先登陆了,才能有cookies吧?可以在代码中加一段休眠时间,在休眠时间我们手动完成登陆,休眠过后,再让代码记录cookies即可。

import time

from msedge.selenium_tools import Edge, EdgeOptions
import chardet

# 返回一个driver对象
def activate_selenium_driver():
    options = EdgeOptions()
    # options.use_chromium = True
    options.add_experimental_option('excludeSwitches', ['enable-automation'])
    options.binary_location = r"C:\Program Files (x86)\Microsoft\Edge\Application\msedge.exe"  # 浏览器的位置
    driver = Edge(options=options, executable_path=r"D:\ERic\WORK\python\Spider\msedgedriver.exe")  # 相应的浏览器的驱动位置
    return driver

def check_charset(file_path):
    with open(file_path, "rb") as f:
        data = f.read(4)
        charset = chardet.detect(data)['encoding']
    return charset

baseurl = 'https://www.airbnb.cn/s/%E6%B7%B1%E5%9C%B3/homes?refinement_paths%5B%5D=%2Fhomes&current_tab_id=home_tab&selected_tab_id=home_tab&screen_size=large&hide_dates_and_guests_filters=false&place_id=ChIJkVLh0Aj0AzQRyYCStw1V7v0&map_toggle=false'
driver = activate_selenium_driver()
driver.get(baseurl)

# 20秒的休眠时间以手动完成登陆
for i in range(0, 20):
    print(20 - i)
    time.sleep(1)

# 获取cookies
cookies = driver.get_cookies()

# 保存到本地
with open('cookies.txt', 'w', encoding=check_charset('cookies.txt')) as f:
    for i in cookies:
        f.write(str(i))
        f.write('\n')

携带cookies实现免密登陆:

baseurl = 'https://www.airbnb.cn/s/%E6%B7%B1%E5%9C%B3/homes?refinement_paths%5B%5D=%2Fhomes&current_tab_id=home_tab&selected_tab_id=home_tab&screen_size=large&hide_dates_and_guests_filters=false&place_id=ChIJkVLh0Aj0AzQRyYCStw1V7v0&map_toggle=false'
driver.get(baseurl)
cookies = []
with open('cookies.txt', 'r', encoding=funcs.funcs.check_charset('cookies.txt')) as f:
    for i in f:
        cookies.append(eval(i.strip()))

for i in cookies:
    driver.add_cookie(i)

time.sleep(3)
driver.refresh()

再次打开Airbnb时,发现已经是登陆状态,大功告成辣。

到此这篇关于Python selenium+cookie实现免密登陆的示例代码的文章就介绍到这了,更多相关selenium cookie免密登陆内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • Python3+selenium实现cookie免密登录的示例代码

    进过两天的研究终于实现了cookie的免密登录,其实就是session.特别开心,因为在Python爬虫群里问那些大佬,可是他们的回答令我寒心,自己琢磨!!! 靠谁比如靠自己,为此我总结下经验,以免入门的小白再次踩这样的吭.其实网上很多博客写的都比较不详细甚 首先问题自己思考,不懂得去群里问问,然后最重要的要理解事物的本质,只有理解后才能运用它:最后在百度一下把所有相关的博客都点开,一条一条的看一遍总结下规律,比较喽的就舍弃,这样基本上都能得到启发作用.比如selenium的本质就是操作浏览器的

  • Python selenium+cookie实现免密登陆的示例代码

    目录 获取cookies: 携带cookies实现免密登陆: 今天爬取airbnb的租房数据时,遇到了登陆问题.自己动手解决了一下. 我们知道,http是无状态的,那么网页如何实现用户登陆注册功能呢?Session和Cookie就是为了满足这种需求出现的技术. 首先介绍一下Session和Cookie的概念. 在Web中Session对象存储特定用户会话所需的属性及配置信息.这样,当用户在应用程序的Web页之间跳转时,存储在Session对象中的变量将不会丢失,而是在整个用户会话中一直存在下去.

  • Vue elementUI实现免密登陆与号码绑定功能

    目录 前言 登录功能 绑定/解绑功能 获取用户信息功能 获取用户信息功能 最终效果 项目地址 前言 前端代码的框架采用vue.js + elementUI 这套较为简单的方式实现,以及typescript语法更方便阅读. 首先来编写发送验证码函数, 登录,绑定,解绑的业务都需要发送验证码功能,通过currentVerifyingType 来区别当前验证码种类.也就是在服务端的Purpose目的. VerifyingType 可以为LOGIN,UNBIND_PHONENUMBER或BIND_PHO

  • 使用python的pexpect模块,实现远程免密登录的示例

    说明 当我们需要用脚本实现,远程登录或者远程操作的时候,都要去解决如何自动输入密码的问题,一般来说有3种实现方式: 1).配置公钥私钥 2).使用shell下的命令,expect 3).使用python的pexpect模块 下面介绍的代码,是使用python的pexpect模块实现的: 代码 import os import sys import pexpect import datetime #获取昨天的日期 date_yes = (datetime.date.today()-datetime

  • xshell 远程登陆CentOS7 免密登陆的思路详解

    首先说一下大体的思路: 1. 以密码登陆CentOS系统 2. 配置ssh 3. xshell 生成秘钥 4. 进行免密登陆 软件.设备: xshell(下载地址(免费版),也可以自行百度下载) CentOS7.5 (百度云服务器) 接下来言归正传: 1. 密码远程连接CentOS 打开xshell -- 文件 -- 新建,会弹出如下图的界面 说明一下里面需要修改的地方 名称:为了区分服务器,名字随便起协议:默认ssh就好主机:CentOS系统所在的机器的IP地址端口:默认22就可以重新连接:有

  • vscode连接远程Linux服务器及免密登陆的详细步骤

    目录 写在开头 步骤1:在本机生成公钥和私钥 步骤2:在vscode安装Remote-SSH 步骤3:服务器端添加私钥到authorized_keys 步骤4:本机配置vscode文件 步骤5:选择服务器文件夹开始使用 写在开头 做深度学习科研难免需要较大的算力,此时就需要在GPU服务器上运行自己的程序.之前,我通过scp命令把代码上传到服务器后,在终端ssh连接服务器,通过一系列的Linux命令进行数据集和模型的操作.其实cd ls这些命令都还很方便,但是当我需要查看或修改源码时,用vim编辑

  • Python 微信公众号文章爬取的示例代码

    一.思路 我们通过网页版的微信公众平台的图文消息中的超链接获取到我们需要的接口 从接口中我们可以得到对应的微信公众号和对应的所有微信公众号文章. 二.接口分析 获取微信公众号的接口: https://mp.weixin.qq.com/cgi-bin/searchbiz? 参数: action=search_biz begin=0 count=5 query=公众号名称 token=每个账号对应的token值 lang=zh_CN f=json ajax=1 请求方式: GET 所以这个接口中我们

  • python图片验证码识别最新模块muggle_ocr的示例代码

    一.官方文档 https://pypi.org/project/muggle-ocr/ 二模块安装 pip install muggle-ocr # 因模块过新,阿里/清华等第三方源可能尚未更新镜像,因此手动指定使用境外源,为了提高依赖的安装速度,可预先自行安装依赖:tensorflow/numpy/opencv-python/pillow/pyyaml 三.使用代码 # 导入包 import muggle_ocr # 初始化:model_type 包含了 ModelType.OCR/Model

  • Selenium之模拟登录铁路12306的示例代码

    最近接触了一些selenium模块的相关知识,觉得还挺有意思的,于是决定亲自尝试写一些爬虫程序来强化selenium模块(一定要多尝试.多动手.多总结).本文主要使用python爬虫来模拟登录铁路12306官网.这儿得吐槽一句,铁路12306网站的反爬机制做的还是比较好. 话不多说,下面跟小墨一起来学习如何通过爬虫来实现铁路12306的登录. 一. 验证码破解 当我们输入账号和密码后,在点击登录按钮之前,还需要对验证码进行操作.对验证码的识别,已经有相关的处理平台,我们只需要借助第三方平台即可.

  • Python下载网易云歌单歌曲的示例代码

    今天写了个下载脚本,记录一下 效果: 直接上代码: # 网易云 根据歌单链接下载MP3歌曲 import requests from bs4 import BeautifulSoup def main(): url = "https://music.163.com/#/playlist?id=3136952023" # 歌单地址 请自行更换 if '/#/' in url: url = url.replace('/#/', '/') headers = { 'Referer': 'ht

随机推荐