Python实现新版正方系统滑动验证码识别

目录
  • 步骤一:点击数据分析
  • 步骤二:滑动验证码图像分析,计算滑动距离x值
  • 步骤三:生成提交参数

Python实现新版正方系统滑动验证码识别算法和方案

步骤一:点击数据分析

点击滑动按钮,将发送一个请求到 /zfcaptchaLogin

请求内容

"type": "verify"
"rtk": "6cfab177-afb2-434e-bacf-06840c12e7af"
"time": "1624611806948"
"mt": "W3sieCI6OTY1LCJ5IjoxNjksInQiOjE2MjQ2MTE4MDY4Njh9LHsieCI6OTY1LCJ5IjoxNjksInQiOjE2MjQ2MTE4MDY5NDh9XQ=="
"instanceId": "zfcaptchaLogin"
"extend": "eyJhcHBOYW1lIjoiTmV0c2NhcGUiLCJ1c2VyQWdlbnQiOiJNb3ppbGxhLzUuMCAoTWFjaW50b3NoOyBJbnRlbCBNYWMgT1MgWCAxMF8xNV83KSBBcHBsZVdlYktpdC81MzcuMzYgKEtIVE1MLCBsaWtlIEdlY2tvKSBDaHJvbWUvOTEuMC40NDcyLjEwNiBTYWZhcmkvNTM3LjM2IiwiYXBwVmVyc2lvbiI6IjUuMCAoTWFjaW50b3NoOyBJbnRlbCBNYWMgT1MgWCAxMF8xNV83KSBBcHBsZVdlYktpdC81MzcuMzYgKEtIVE1MLCBsaWtlIEdlY2tvKSBDaHJvbWUvOTEuMC40NDcyLjEwNiBTYWZhcmkvNTM3LjM2In0="

通过 base64 解密 mt和 extend 得出解密的数值

# mt
[{"x":965,"y":169,"t":1624611806868},{"x":965,"y":169,"t":1624611806948}]
# extend
{"appName":"Netscape","userAgent":"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.106 Safari/537.36","appVersion":"5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.106 Safari/537.36"}

mt 为用户的点击行为,x为X轴上的值,y为Y轴上的值,t为时间戳。通过大量点击分析,发现x值最小值为 950,得出950 为 X轴的起点,y值随机无固定值。

extend 为请求头部内容

步骤二:滑动验证码图像分析,计算滑动距离x值

将图像灰度化,通过getpixel可以获取图像某一点的颜色值, 颜色值越高代表图像越浅,所以寻找纵向连续50个像素点均是 getpixel(x+1, y) > getpixel(x, y)(X轴=x 比 X轴=x+1 颜色浅)

并扫描图像,当x=130、扫描高度=50时,的颜色比x+1时深。

from PIL import Image
import matplotlib.pyplot as plt
import numpy as np

scanf_height= 50 # 扫描的高度
img = Image.open("zfcaptchaLogin.png")

def contrast(imgl, x, y,scanf_height):
    # 黄框颜色值比红框颜色值浅的个数
    count = 0
    for i in range(scanf_height):
        if imgl.getpixel((x+1, y+i)) > imgl.getpixel((x, y+i)):
            count += 1
    # 当 count = scanf_height, 代表黄条区域 整体 红条区域 颜色值浅,则是验证码框位置
    return count

def scanf(img):
    imgx, imgy = img.size
    imgl = img.convert('L') # 图像灰度化
    plt.yticks([])
    plt.xticks([i for i in range(0, imgx, 25)])
    plt.imshow(img)
    plt.pause(0.5)
    for y in range(0, imgy-scanf_height, 10):
        plt.pause(0.01)
        plt.clf()
        plt.yticks([])
        plt.xticks([i for i in range(0, imgx, 25)])
        plt.imshow(imgl, cmap=plt.cm.gray)
        for x in range(1, imgx-1, 1):
            plt.pause(0.0001)
            plt.plot([x-1,x-1], [y, y+scanf_height], color='white')
            plt.plot([x,x], [y, y+scanf_height], color='red')
            plt.plot([x+1,x+1], [y, y+scanf_height], color='yellow')
            count = contrast(imgl, x,y, scanf_height)
            plt.title('count: {}'.format(count) )

            print("x,y=[{}, {}], 黄条区域值比红条区域颜色值浅的个数:{}".format(x,y, count))
            if count == scanf_height:
                return

scanf(img)
plt.show()

优化代码计算x,y值

import json
import random
import time
from io import BytesIO

from PIL import Image

class ZfCaptchaRecognit(object):
    def __init__(self, img_path):
        self.img = Image.open(img_path)

    def _get_xy(self):
        # 计算 x,y 值
        def _is_dividing_line(img_l, x, y):
            for n in range(50):
                # 寻找纵向连续50个像素点均是 X=x 比 X=x+1 颜色深
                if y + n >= img_l.size[1] or x >= img_l.size[0] - 1:
                    return False
                if img_l.getpixel((x + 1, y + n)) - img_l.getpixel((x, y + n)) < 2:
                    return False
            return True

        img_l = self.img.convert("L")
        for x in range(img_l.size[0]):
            for y in range(img_l.size[1]):
                if _is_dividing_line(img_l, x, y):
                    return (x, y)

    def show_tag(self):
        # 展示 切分点
        X, Y = self._get_xy()
        img2 = Image.new("RGB", self.img.size, (255, 255, 255))
        for x in range(self.img.size[0]):
            for y in range(self.img.size[1]):
                pix = self.img.getpixel((x, y))
                img2.putpixel((x, y), pix)
                if x == X or y == Y:
                    img2.putpixel((x, y), 225)

        img2.save("show_tag.png")
        img2.show()

captcha = ZfCaptchaRecognit("zfcaptchaLogin.png")
captcha.show_tag()

步骤三:生成提交参数

通过 步骤一得出x值最小为950,y值无规律

则提交参数mt的大致格式数据是

[{
    "x":950+ 滑动距离 + 浮动值,  #  浮动值的范围通过分析提交参数得出在10~20内
    "y":random.randint(150, 190),  # 无规律,暂定150到190范围内
    "t":int(time.time() * 1000)},  # 时间戳
 ...]

获取mt 参数

import json
import random
import time
from io import BytesIO

from PIL import Image

class ZfCaptchaRecognit(object):
    def __init__(self, img_stream):
        obj = BytesIO(img_stream)
        self.img = Image.open(obj)

    def _get_xy(self):
        ...

    def generate_payload(self):
        base_x = 950
        X, Y = self._get_xy()
        payloads = [{"x": base_x + random.randint(5, 20), "y": random.randint(150, 190), "t": int(time.time() * 1000)}]
        for i in range(random.randint(15, 30)):
            # 在上一个参数基础下浮动
            last_payload = payloads[-1].copy()
            payloads[0]["x"] += random.choice([0] * 8 + [1, -1] * 2 + [2, -2])
            last_payload["t"] += random.randint(1, 20)
            last_payload["y"] += random.choice([0] * 8 + [1, -1] * 2 + [2, -2])
            payloads.append(last_payload)

        payloads[-1]["x"] = base_x + random.randint(10, 20) + X
        return json.dumps(payloads)

captcha = ZfCaptchaRecognit("zfcaptchaLogin.png")
captcha. generate_payload()

以上就是Python实现新版正方系统滑动验证码识别的详细内容,更多关于Python滑动验证码识别的资料请关注我们其它相关文章!

(0)

相关推荐

  • python验证码识别教程之滑动验证码

    前言 上篇文章记录了2种分割验证码的方法,此外还有一种叫做"滴水算法"(Drop Fall Algorithm)的方法,但本人智商原因看这个算法看的云里雾里的,所以今天记录滑动验证码的处理吧.网上据说有大神已经破解了滑动验证码的算法,可以不使用selenium来破解,但本人能力不足还是使用笨方法吧. 基础原理很简单,首先点击验证码按钮后的图片是滑动后的完整结果,点击一下滑块后会出现拼图,对这2个分别截图后比较像素值来找出滑动距离,并结合selenium来实现拖拽效果. 至于seleni

  • Python3爬虫关于识别检验滑动验证码的实例

    上节我们了解了图形验证码的识别,简单的图形验证码我们可以直接利用 Tesserocr 来识别,但是近几年又出现了一些新型验证码,如滑动验证码,比较有代表性的就是极验验证码,它需要拖动拼合滑块才可以完成验证,相对图形验证码来说识别难度上升了几个等级,本节来讲解下极验验证码的识别过程. 1. 本节目标 本节我们的目标是用程序来识别并通过极验验证码的验证,其步骤有分析识别思路.识别缺口位置.生成滑块拖动路径,最后模拟实现滑块拼合通过验证. 2. 准备工作 本次我们使用的 Python 库是 Selen

  • python自动化操作之动态验证码、滑动验证码的降噪和识别

    目录 前言 一.动态验证码 二.滑动验证码 三.验证码的降噪 四.验证码的识别 总结 前言 python对动态验证码.滑动验证码的降噪和识别,在各种自动化操作中,我们经常要遇到沿跳过验证码的操作,而对于验证码的降噪和识别,的确困然了很多的人.这里我们就详细讲解一下不同验证码的降噪和识别. 一.动态验证码 动态验证码是服务端生成的,点击一次,就会更换一次,这就会造成很多人在识别的时候,会发现验证码一直过期 这是因为,如果你是把图片下载下来,进行识别的话,其实在下载的这个请求中,其实相当于点击了一次

  • 使用Python的OpenCV模块识别滑动验证码的缺口(推荐)

    最近终于找到一个好的方法,使用Python的OpenCV模块识别滑动验证码的缺口,可以将滑动验证码中的缺口识别出来了. 测试使用如下两张图片: target.jpg template.png 现在想要通过"template.png"在"target.jpg"中找到对应的缺口,代码实现如下: # encoding=utf8 import cv2 import numpy as np def show(name): cv2.imshow('Show', name) cv

  • Python3网络爬虫开发实战之极验滑动验证码的识别

    上节我们了解了图形验证码的识别,简单的图形验证码我们可以直接利用 Tesserocr 来识别,但是近几年又出现了一些新型验证码,如滑动验证码,比较有代表性的就是极验验证码,它需要拖动拼合滑块才可以完成验证,相对图形验证码来说识别难度上升了几个等级,本节来讲解下极验验证码的识别过程. 1. 本节目标 本节我们的目标是用程序来识别并通过极验验证码的验证,其步骤有分析识别思路.识别缺口位置.生成滑块拖动路径,最后模拟实现滑块拼合通过验证. 2. 准备工作 本次我们使用的 Python 库是 Selen

  • Python实现新版正方系统滑动验证码识别

    目录 步骤一:点击数据分析 步骤二:滑动验证码图像分析,计算滑动距离x值 步骤三:生成提交参数 Python实现新版正方系统滑动验证码识别算法和方案 步骤一:点击数据分析 点击滑动按钮,将发送一个请求到 /zfcaptchaLogin 请求内容 "type": "verify" "rtk": "6cfab177-afb2-434e-bacf-06840c12e7af" "time": "16246

  • python爬虫之自动登录与验证码识别

    在用爬虫爬取网站数据时,有些站点的一些关键数据的获取需要使用账号登录,这里可以使用requests发送登录请求,并用Session对象来自动处理相关Cookie. 另外在登录时,有些网站有时会要求输入验证码,比较简单的验证码可以直接用pytesser来识别,复杂的验证码可以依据相应的特征自己采集数据训练分类器. 以CSDN网站的登录为例,这里用Python的requests库与pytesser库写了一个登录函数.如果需要输入验证码,函数会首先下载验证码到本地,然后用pytesser识别验证码后登

  • python识别和降噪动态验证码与滑动验证码

    目录 一.动态验证码 二.滑动验证码 三.验证码的降噪 四.验证码的识别 〝 古人学问遗无力,少壮功夫老始成 〞 python对动态验证码.滑动验证码的降噪和识别,在各种自动化操作中,我们经常要遇到沿跳过验证码的操作,而对于验证码的降噪和识别,的确困然了很多的人.这里我们就详细讲解一下不同验证码的降噪和识别.如果这篇文章能给你带来一点帮助,希望各位小伙伴们多多支持我们. 一.动态验证码 动态验证码是服务端生成的,点击一次,就会更换一次,这就会造成很多人在识别的时候,会发现验证码一直过期 这是因为

  • Python用 KNN 进行验证码识别的实现方法

    前言 之前做了一个校园交友的APP,其中一个逻辑是通过用户的教务系统来确认用户是一名在校大学生,基本的想法是通过用户的账号和密码,用爬虫的方法来确认信息,但是许多教务系统都有验证码,当时是通过本地服务器去下载验证码,然后分发给客户端,然后让用户自己填写验证码,与账号密码一并提交给服务器,然后服务器再去模拟登录教务系统以确认用户能否登录该教务系统.验证码无疑让我们想使得用户快速认证的想法破灭了,但是当时也没办法,最近看了一些机器学习的内容,觉得对于大多数学校的那些极简单的验证码应该是可以用KNN这

  • Python实现字符型图片验证码识别完整过程详解

    1摘要 验证码是目前互联网上非常常见也是非常重要的一个事物,充当着很多系统的防火墙功能,但是随时OCR技术的发展,验证码暴露出来的安全问题也越来越严峻.本文介绍了一套字符验证码识别的完整流程,对于验证码安全和OCR识别技术都有一定的借鉴意义. 本文的基于传统的机器学习SVM的源码共享:https://github.com/zhengwh/captcha-svm 2关键词 关键词:安全,字符图片,验证码识别,OCR,Python,SVM,PIL 3免责声明 本文研究所用素材来自于某旧Web框架的网

随机推荐