Android利用爬虫实现模拟登录的实现实例

2025-02-26 21:32:29

Android利用爬虫实现模拟登录的实现实例

为了用手机登录校网时不用一遍一遍的输入账号密码，于是决定用爬虫抓取学校登录界面，然后模拟填写本次保存的账号、密码，模拟点击登录按钮。实现过程折腾好几个。

一开始选择的是htmlunit解析登录界面html，在pc上测的能实现，结果在android上运行不起来，因为htmlunit利用了javax中的类实现的解析，android不支持javax，所以就跑不起来。

不过pc还是ok的

实例代码：

package com.yasin;

import java.io.IOException;
import java.net.MalformedURLException;
import java.net.URL;
import java.util.List;

import org.junit.Test;

import com.gargoylesoftware.htmlunit.BrowserVersion;
import com.gargoylesoftware.htmlunit.WebClient;
import com.gargoylesoftware.htmlunit.html.HtmlForm;
import com.gargoylesoftware.htmlunit.html.HtmlInput;
import com.gargoylesoftware.htmlunit.html.HtmlPage;
import com.gargoylesoftware.htmlunit.html.HtmlPasswordInput;
import com.gargoylesoftware.htmlunit.html.HtmlSubmitInput;
import com.gargoylesoftware.htmlunit.html.HtmlTextInput;

public class AutoLogin {

  String url = "http://172.16.10.3/";

  @Test
  public void run(){

    try{
      WebClient webClient = new WebClient(BrowserVersion.CHROME);
      //htmlunit 对css和javascript的支持不好，所以请关闭之
      webClient.getOptions().setJavaScriptEnabled(false);
      webClient.getOptions().setCssEnabled(false);
      HtmlPage page = (HtmlPage)webClient.getPage(url);

      List<HtmlForm> forms = page.getForms();
      HtmlForm form = forms.get(0);

      HtmlTextInput name = form.getInputByName("DDDDD");
      name.setValueAttribute("/*填写你的账号*/");
      HtmlPasswordInput pass = form.getInputByName("upass");
      pass.setValueAttribute("/*你的密码*/");
      HtmlSubmitInput ok = form.getInputByName("0MKKey");
      System.out.println(pass.toString());
      ok.click();
    }catch(Exception e){
      System.out.println(e.toString());
    }

  }
}

于是接着调研，发现利用jsoup可以在android运行起来，不过这个库能抓取网页中的内容，也能进行赋值操作，但不支持模拟点击事件，网上有好多例子，是利用第一次访问获取cookie，然后把账号密码再给Post到服务器，完成模拟登陆。可以我们的校网竟然没有使用cookie，于是我只能抓包看看post的data有什么，然后把data直接通过post发送，不过不知道我们校网密码的加密的方式，所以填写密码需要先去抓包，抓到自己账号的密文，然后放到data中直接发送。成功了！

核心代码：

public void login() throws IOException{
    Map<String,String> datas = new HashMap<String,String>();

    Connection con = Jsoup.connect("http://172.16.10.3/");
    con.header("User-Agent", "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:29.0) Gecko/20100101 Firefox/29.0");//配置模拟浏览器
    Response rs= con.execute();//获取响应
    Document doc = Jsoup.parse(rs.body());

    datas.put("DDDDD", "/*自己的账号*/");
    datas.put("upass", "/*自己密码的密文，需抓包获取*/");
    datas.put("R1", "0");
    datas.put("R2", "1");
    datas.put("0MMKey", "123456");
    System.out.println(datas.toString());
    Connection con2=Jsoup.connect("http://172.16.10.3/");
    con2.header("User-Agent", "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:29.0) Gecko/20100101 Firefox/29.0");
     //设置cookie和post上面的map数据.cookies(rs.cookies())
    Response login=con2.ignoreContentType(true).method(Method.POST).data(datas).execute();

    Message msg = new Message();
    msg.what = 1;
    mHandler.sendMessage(msg);

  }

抓包方式：

点击登录后快速停止监听，获取form data，然后把data中的值填上就好了。

总的来说，如果只是单纯抓取网页内容android这一块利用jsoup还是能实现的，但不支持按钮的点击操作；Htmlunit API更好用，也能模拟点击事件，不过javax android并不支持，但服务器还是可以用来抓取数据的。

如有疑问请留言或者到本站社区交流讨论，感谢阅读，希望能帮助到大家，谢谢大家对本站的支持！

Android编写简单的网络爬虫

一.网络爬虫的基本知识网络爬虫通过遍历互联网络,把网络中的相关网页全部抓取过来,这体现了爬的概念.爬虫如何遍历网络呢,互联网可以看做是一张大图,每个页面看做其中的一个节点,页面的连接看做是有向边.图的遍历方式分为宽度遍历和深度遍历,但是深度遍历可能会在深度上过深的遍历或者陷入黑洞.所以,大多数爬虫不采用这种形式.另一方面,爬虫在按照宽度优先遍历的方式时候,会给待遍历的网页赋予一定优先级,这种叫做带偏好的遍历. 实际的爬虫是从一系列的种子链接开始.种子链接是起始节点,种子页面的超链接指向的页面是
Android利用爬虫实现模拟登录的实现实例

Android利用爬虫实现模拟登录的实现实例为了用手机登录校网时不用一遍一遍的输入账号密码,于是决定用爬虫抓取学校登录界面,然后模拟填写本次保存的账号.密码,模拟点击登录按钮.实现过程折腾好几个. 一开始选择的是htmlunit解析登录界面html,在pc上测的能实现,结果在android上运行不起来,因为htmlunit利用了javax中的类实现的解析,android不支持javax,所以就跑不起来. 不过pc还是ok的实例代码: package com.yasin; import jav
python 利用浏览器 Cookie 模拟登录的用户访问知乎的方法

首先在火狐浏览器上登录知乎,然后使用火狐浏览器插件 Httpfox 获取 GET 请求的Cookie,这里注意使用状态值为 200(获取成功)的某次GET. 将 Cookies 复制出来,注意这一行非常长,不要人为添加换行符.而且 Cookie 中使用了双引号,最后复制到代码里使用单引号包起来. 使用下边代码检验是否是模拟了登录的用户的请求: import requests import re headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT
python网络爬虫之模拟登录自动获取cookie值验证码识别的具体实现

目录 1.爬取网页分析 2.验证码识别 3.cookie自动获取 4.程序源代码 chaojiying.py sign in.py 1.爬取网页分析爬取的目标网址为:https://www.gushiwen.cn/ 在登陆界面需要做的工作有,获取验证码图片,并识别该验证码,才能实现登录. 使用浏览器抓包工具可以看到,登陆界面请求头包括cookie和user-agent,故在发送请求时需要这两个数据.其中user-agent可通过手动添加到请求头中,而cookie值需要自动获取. 分析完毕,实践
利用Python实现模拟登录知乎

目录环境与开发工具模拟过程概述参数探索模拟源码运行结果结果一:密码错误结果二:验证码错误结果三:成功登录环境与开发工具在抓包的时候,开始使用的是Chrome开发工具中的Network,结果没有抓到,后来使用Fiddler成功抓取数据.下面逐步来细化上述过程. 模拟知乎登录前,先看看本次案例使用的环境及其工具: Windows 7 + Python 2.75 Chrome + Fiddler: 用来监控客户端与服务器的通讯情况,以及查找相关参数的位置. Github源码下载模
python爬虫之模拟登陆csdn的实例代码

python模拟登陆网页主要使用到urllib.urllib2.cookielib及BeautifulSoup等基本模块,当然进阶阶段我们还可以使用像requests等更高级一点的模块.其中BeautifulSoup模块在匹配html方面,可以很好的代替re,使用起来更方便,对于不会使用正则的人来说是福音. 本文使用python2.7 原理模拟登陆前,我们需要先知道csdn是如何登陆的.我们通过google chrome浏览器先来分析下: 1.chrome浏览器用F12或ctrl+shift+
Android利用ZXing扫描二维码的实例代码解析

相关阅读: Android开发框架之自定义ZXing二维码扫描界面并解决取景框拉伸问题此项目源码地址:请点击这里看一下zxing的项目结构,我这里直接拿过来用的看一下扫码的activity: package com.fanyafeng.barcode.activity; import android.content.Intent; import android.graphics.Bitmap; import android.net.Uri; import android.os.Bundle
Android利用listview控件操作SQLite数据库实例

在本实例中,首先我们利用SQLiteOpenHelper类建立一个数据库,并写好增.删.查等方法,通过SimpleCursorAdapter连接listview实现数据库的增加.查询以及长按删除的功能. 首先,我们先认识一下什么是SQLiteOpenHelper类. Android为了操作SQlite数据库,提供了SQLiteDatabase类,其内封装了insert .delete.update .query .执行SQL命令等操作.同时又为SQLiteDatabase提供了一个辅助类,SQL
Selenium之模拟登录铁路12306的示例代码

最近接触了一些selenium模块的相关知识,觉得还挺有意思的,于是决定亲自尝试写一些爬虫程序来强化selenium模块(一定要多尝试.多动手.多总结).本文主要使用python爬虫来模拟登录铁路12306官网.这儿得吐槽一句,铁路12306网站的反爬机制做的还是比较好. 话不多说,下面跟小墨一起来学习如何通过爬虫来实现铁路12306的登录. 一. 验证码破解当我们输入账号和密码后,在点击登录按钮之前,还需要对验证码进行操作.对验证码的识别,已经有相关的处理平台,我们只需要借助第三方平台即可.
Python模拟登录requests.Session应用详解

最近由于某些原因,需要用到Python模拟登录网站,但是以前对这块并不了解,而且目标网站的登录方法较为复杂, 所以一下卡在这里了,于是我决定从简单的模拟开始,逐渐深入地研究下这块. 注:本文仅为交流学习所用. 登录特点:明文传输,有特殊标志数据会话对象requests.Session能够跨请求地保持某些参数,比如cookies,即在同一个Session实例发出的所有请求都保持同一个cookies,而requests模块每次会自动处理cookies,这样就很方便地处理登录时的cookies问题.
Python爬虫之模拟知乎登录的方法教程

前言对于经常写爬虫的大家都知道,有些页面在登录之前是被禁止抓取的,比如知乎的话题页面就要求用户登录才能访问,而 "登录" 离不开 HTTP 中的 Cookie 技术. 登录原理 Cookie 的原理非常简单,因为 HTTP 是一种无状态的协议,因此为了在无状态的 HTTP 协议之上维护会话(session)状态,让服务器知道当前是和哪个客户在打交道,Cookie 技术出现了 ,Cookie 相当于是服务端分配给客户端的一个标识. 浏览器第一次发起 HTTP 请求时,没有携带任何 Co

Android利用爬虫实现模拟登录的实现实例

相关推荐

随机推荐