易语言爬取网页内容方法

写个辅助工具的时候需要提取网页里面的某些内容,我这里便把方法告诉大家,希望对大家有所帮助,记得投票给我哦!

1、在新建的windos窗口程序中画:

两个编辑框、一个按钮。

再添加模块如图中三步!

我们来实现,在一个编辑框中输入网址后,点击按钮,然后取到指定内容到编辑框2中。

2、比如我们来取百度某贴吧一个帖子内的内容!如下图中的“跑遍数码城,XXXXX”。

我们在该页面上右键---->查看网页源码(或查看源文件)。

3、在打开的源文件内容中按CTRL+F组合键查找“跑遍数码城”,我们只要一个开文中一部分就行了!找到对应的文字后,我们找到和网页中完全对应的那部分代码。

PS:可能会出现几个被找到的内容,但是只要找到你需要取的那段全部对应部分就行。

4、复制正文中的前面的部分代码,不要复制太多的内容,待会我们用正文前的内容找到中间的内容。

然后在易语言中新建一个文本常量,把复制到的内容粘贴到“常量值”里面去。

5、然后我们去复制正文后面的一小段代码,同样新建一个文本常量,然后粘贴到常量值里面去。

6、此时我们回到编程程序中,点击按钮,在生成的“_按钮1_被单击”子程序下面新建一个文本型变量“得到的内容”,然后输入以下代码:

得到的内容 = 网页_访问s (编辑框1.内容)编辑框2.内容 = 文本_取出中间文本 (得到的内容, #常量1, #常量2)

PS:第一行是把把编辑框中的网址打开后得到的网页源码赋值给“得到的内容”这个文本变量。

第二行则是对“得到的文本”进行取中间文本操作,文本_取出中间文本()是一个程序!它能取出中间内容的程序!

7、最后我们把程序调试运行一下,点击按钮“取内容”,是不是成功了呢?打开其他帖子取也是有效的,只要你取前后代码是正确的!

如果你是需要网页的源码,只要使用程序“ 网页_访问s()”,就然后把它赋值输出就OK了。当然!括号里面要有网页地址!

(0)

相关推荐

  • 易语言获取网页源码的方法

    信息爆炸的时代,同样引领者软件产业的不断变化.目前,软件的需求已经不是从单一面向复杂,不单单考虑某一方面的需求而是多方面需求的融合.那么,易语言如何读取网页源码呢?下面,就由MovieClip给大家讲解一下吧! 1.首先,运行"易语言"主程序,弹出"新建工程对话框"选择"Windows窗口程序"然后点击"确定"按钮,进入"Windows窗口程序设计界面".如下图: 2.接下来,拖放标签组件一个.编辑框组件两

  • 易语言表白网页生成器源码

    表白网页生成器 .版本 2 .支持库 iext .支持库 spec .程序集 窗口程序集1 .子程序 _按钮_本地生成_被单击 透明标签3.标题 = "xx提醒您正在生成,,请稍候..." 创建目录 (取运行目录 () + "/本地专用版") 编辑框2.内容 = 子文本替换 (编辑框3.内容, "对方名字", 编辑框_对方名字.内容, , , 真) 延迟 (200) 编辑框5.内容 = 子文本替换 (编辑框2.内容, "自己名字&quo

  • 易语言进行网页操作方法

    首先展示下功能(看图片) 本代码附加了DLL代码命令,会以不同的颜色标注,也可以全部复制后张贴到易语言新建的一个程序集名中,易语言会智能的分开DLL和子程序. 相关源码: .版本 2 .程序集 网页操作累 .子程序 HTTP读文本, 文本型, 公开, 有可能线程阻塞,请在外部加超时判断 .参数 完整网址, 文本型 .参数 访问方式, 文本型, 可空, "GET" or "POST",为空默认"GET" .参数 代理地址, 文本型, 可空 .参数

  • 易语言编写网页刷点击程序

    用易语言中文程序,做一个简单的网页刷新器,用到时钟组件就可以完成. 1.在百度上下载易语言软件进行安装,通过百度"易语言",得出搜索结果,按照步骤进行正常的软件安装即可. 2.安装完毕之后,打开易语言程序,选择windows窗口程序进行启动 3.在拓展组件中找到超文本浏览框,移动到我们窗口程序中,在地址一栏中填写我们要刷新的网址. 4.添加一个时钟组件,时钟组件属性中的时间周期即是我们要刷新的频率,单位是ms,例如我们设置2000,就是2s刷新一次. 5.双击时钟,跳转到时钟子事件程序

  • 易语言网页填表操作

    用易语言编程工具编写网页普通填表 1.用IE浏览器打开百度 2.运行精易编程助手,打开[网页分析]按钮 3.拖动蓝色圆形十字到百度首页 4.分析出的详细信息,查看按钮ID 5.点击精易编程助手中的[窗口探测]查看标题 6.打开易语言,创建窗口句柄 新建一个标签.按钮.编辑框 7.代码如下,一定要普通填表初始化 8. 代码如下:.版本 2.程序集 窗口程序集1.程序集变量 句柄, 整数型.子程序 _按钮1_被单击普通填表.初始化 (句柄)普通填表.文本框_写内容 ("1", 编辑框1.内

  • 易语言修改指定网页为浏览器主页的代码

    监控浏览器进程,结束后用 运行(浏览器目录+" "+地址) 来实现主页修改 DLL命令表 .版本 2 .DLL命令 CoInitialize, 整数型, "Ole32.dll" .参数 pvReserved, 整数型 .DLL命令 CoUninitialize, , "Ole32.dll" .DLL命令 RegisterWindowMessageA, 整数型, , "RegisterWindowMessageA" .参数 lp

  • 易语言爬取网页内容方法

    写个辅助工具的时候需要提取网页里面的某些内容,我这里便把方法告诉大家,希望对大家有所帮助,记得投票给我哦! 1.在新建的windos窗口程序中画: 两个编辑框.一个按钮. 再添加模块如图中三步! 我们来实现,在一个编辑框中输入网址后,点击按钮,然后取到指定内容到编辑框2中. 2.比如我们来取百度某贴吧一个帖子内的内容!如下图中的"跑遍数码城,XXXXX". 我们在该页面上右键---->查看网页源码(或查看源文件). 3.在打开的源文件内容中按CTRL+F组合键查找"跑遍

  • Python下使用Scrapy爬取网页内容的实例

    上周用了一周的时间学习了Python和Scrapy,实现了从0到1完整的网页爬虫实现.研究的时候很痛苦,但是很享受,做技术的嘛. 首先,安装Python,坑太多了,一个个爬.由于我是windows环境,没钱买mac, 在安装的时候遇到各种各样的问题,确实各种各样的依赖. 安装教程不再赘述.如果在安装的过程中遇到 ERROR:需要windows c/c++问题,一般是由于缺少windows开发编译环境,晚上大多数教程是安装一个VisualStudio,太不靠谱了,事实上只要安装一个WindowsS

  • 基于Python的Post请求数据爬取的方法详解

    为什么做这个 和同学聊天,他想爬取一个网站的post请求 观察 该网站的post请求参数有两种类型:(1)参数体放在了query中,即url拼接参数(2)body中要加入一个空的json对象,关于为什么要加入空的json对象,猜测原因为反爬虫.既有query参数又有空对象体的body参数是一件脑洞很大的事情. 一开始先在apizza网站 上了做了相关实验才发现上面这个规律的,并发现该网站的请求参数要为raw形式,要是直接写代码找规律不是一件容易的事情. 源码 import requests im

  • 易语言做浏览器的方法

    各位小朋友还在为电脑浏览记录被家长监视而发愁吗,有了它,再也不用担心啦. 1.新建一个Windows窗口程序 2.尽量把窗口拉大,越大越好.并放上一个超文本浏览框,按钮.如图 3.下面复制就可以了: .版本 2.支持库 HtmlView .子程序 __启动窗口_创建完毕 超文本浏览框1.地址 = "www.baidu.com\" '在引号内输入要载入的网址 .子程序 _超文本浏览框1_即将打开新窗口, 逻辑型 超文本浏览框1.地址 = 超文本浏览框1.状态条文本返回 (假) .子程序

  • 在scrapy中使用phantomJS实现异步爬取的方法

    使用selenium能够非常方便的获取网页的ajax内容,并且能够模拟用户点击和输入文本等诸多操作,这在使用scrapy爬取网页的过程中非常有用. 网上将selenium集成到scrapy的文章很多,但是很少有能够实现异步爬取的,下面这段代码就重写了scrapy的downloader,同时实现了selenium的集成以及异步. 使用时需要PhantomJSDownloadHandler添加到配置文件的DOWNLOADER中. # encoding: utf-8 from __future__ i

  • python爬取网页内容转换为PDF文件

    本文实例为大家分享了python爬取网页内容转换为PDF的具体代码,供大家参考,具体内容如下 将廖雪峰的学习教程转换成PDF文件,代码只适合该网站,如果需要其他网站的教程,可靠需要进行稍微的修改. # coding=utf-8 import os import re import time import pdfkit import requests from bs4 import BeautifulSoup from PyPDF2 import PdfFileMerger import sys

  • 易语言读取QQWary地理位置方法

    很多的功能需要查询IP地址的物理位置,这是一个前辈写好的子程序 使用方法:在自己的子程序中直接调用[IP查询("IP地址")即可,可以是变量] .版本 2 .程序集 程序集_查询IP .子程序 _启动子程序, 整数型, , 请在本子程序中放置易模块初始化代码 _查询IP () ' 在初始化代码执行完毕后调用测试代码 返回 (0) ' 可以根据您的需要返回任意数值 .子程序 _查询IP ' 本名称子程序用作测试程序用,仅在开发及调试环境中有效,编译发布程序前将被系统自动清空,请将所有用作

  • 易语言怎么输入负数?易语言输入负数的方法

    易语言怎么输入负数,我试过在数字前加  -   符号发现不行,后来找到了输入方法,我一步步教给大家. 1.打开易语言新建一个windows程序点击进入代码编辑区 2.我们这里用到一个命令就是取整 3.这个函数比较简单就一个参数输入小数就行 我们输入9.1999 4.然后我们调试输出看看 5.运行看看结果 结果为9 6.我们测试下其他数据 我们输入 1023.3 运行结果如图 1023 函数非常好用 总结:以上就是简单的易语言输入负数的六个步骤内容,感谢大家对我们的支持.

  • 易语言提高安全性的方法总结

    易语言是汉化的编译软件,编译软件哦,如同,JAVA,C++,VB,等等编译软件哦,对于对英语一窍不通的人,一般都适合选择易语言进行编译软件哦,编译出来的软件也有安全性哦,下面一个方法教大家如何提高安全性. 1.首先,找到你电脑中里面的易语言软件,找到了,就说一声. 2.跟往常一样,进入易语言软件,打开一个窗口就行了. 3.找到工具,一般人我都不告诉他就在上面,可能你也会找不到的哦. 4.点击系统配置,图片上忘记标注了,不好意思,点击过后就可以进来了.然后选择3,3是最高的了. 5.下面的一般可以

  • 易语言随机取文本内容方法

    易语言怎么随机取出文本里面的随机内容? 需要下载的模块:精易模块 代码如下: .版本 2 .子程序 随机一句话, 文本型, , 在按钮事件下直接调用这个函数就可以了,那个文本.txt中的话可以自己编辑 .局部变量 文本, 文本型 文本 = 到文本 (读入文件 (取运行目录 () + "\文本.txt")) 置随机数种子 () 返回 (文本_取指定变量文本行 (文本, 取随机数 (1, 文本_取行数 (文本)))) 复制粘贴即可. 文本保存格式:用换行分割想取出的随机内容. 代码很简单,

随机推荐