易语言用正则采集百度知道的代码

常量数据表

.版本 2
.常量 标题, "<文本长度: 25>", , "ti"((\r\n|\s*).*>.*)</a>
.常量 标题需替换的内容, "<文本长度: 17>", , target="_blank">
.常量 提问时间, "<文本长度: 36>", , "mr-8">(\d{4,}-\d{1,}-\d{1,})</span>
.常量 帖子链接与回答数量, "<文本长度: 93>", , <a href="(http:.*)" rel="external nofollow" target="_blank" class="f-light nod" data-   log="pos:ans,si:\d{1,}">(.*)</a>
.常量 回答内容, "<文本长度: 40>", , <i class="i-answer-text">答:</i>.*</dd>
.常量 回答内容需替换的, "<文本长度: 25>", , <i class="i-answer-text">
.常量 回答者, "<文本长度: 27>", , 回答者:<a href=.*>(.*)</a>

百度知道采集器

此功能需要加载精易模块5.6

.版本 2
.支持库 iext
.程序集 窗口程序集1
.程序集变量 搜索的内容, 文本型
.程序集变量 网页源码, 文本型
.程序集变量 页码变量, 整数型
.程序集变量 网址, 文本型
.子程序 _按钮_搜索_被单击
.局部变量 i, 整数型
.局部变量 i2, 整数型
.局部变量 i3, 整数型
.如果 (编辑框_搜索内容.内容 ≠ “”)
  超级列表框1.全部删除 ()
  .判断循环首 (页码变量 < 21)
    搜索内容 ()
    正则 ()
    页码变量 = 页码变量 + 10
  .判断循环尾 ()
  .计次循环首 (超级列表框1.取表项数 (), i2)
    超级列表框1.置标题 (i2 - 1, 0, 到文本 (i2))
  .计次循环尾 ()
  页码变量 = 0
.否则
  信息框 (“请先输入要搜索的问题”, #信息图标, “提示”)
  编辑框_搜索内容.获取焦点 ()
.如果结束
.子程序 搜索内容
按钮_搜索.标题 = “正在搜索中...”
搜索的内容 = 编辑框_搜索内容.内容
网址 = “http://zhidao.baidu.com/search?word=” + 编码_URL编码 (搜索的内容) + “&ie=gbk&site=-1&sites=0&date=0&pn=” + 到文本 (页码变量)
网页源码 = 网页_取网页源码 (网址)
.子程序 正则
.局部变量 正则标题与序号, 正则表达式类
.局部变量 局_计次, 整数型
.局部变量 表项索引, 整数型
.局部变量 正则链接与回答数, 正则表达式类
.局部变量 正则回答, 正则表达式类
.局部变量 正则回答时间, 正则表达式类
.局部变量 正则回答者, 正则表达式类
正则标题与序号.创建 (#标题, 网页源码)
正则链接与回答数.创建 (#帖子链接与回答数量, 网页源码)
正则回答.创建 (#回答内容, 网页源码)
正则回答时间.创建 (#提问时间, 网页源码)
正则回答者.创建 (#回答者, 网页源码)
.计次循环首 (正则标题与序号.取匹配数量 (), 局_计次)
  表项索引 = 超级列表框1.插入表项 (, , , , , )
  超级列表框1.置标题 (表项索引, 1, 文本_替换 (正则标题与序号.取子匹配文本 (局_计次, 1), , , , “>”, “”, “<em>”, “”, “</em>”, “</a>”, “<em”, “”, “</em”, “”)) ' 标题
  .如果 (寻找文本 (正则链接与回答数.取子匹配文本 (局_计次, 1), “html”, , 假) = -1)
    超级列表框1.置标题 (表项索引, 4, “”)
  .否则
    超级列表框1.置标题 (表项索引, 4, 正则链接与回答数.取子匹配文本 (局_计次, 1)) ' 链接
  .如果结束
  超级列表框1.置标题 (表项索引, 2, 文本_替换 (正则回答.取匹配文本 (局_计次, ), , , , #回答内容需替换的, “”, “</i>”, “”, “<em>”, “”, “</em>”, “”, “</dd>”, “”)) ' 回答
  超级列表框1.置标题 (表项索引, 3, 正则链接与回答数.取子匹配文本 (局_计次, 2)) ' 回答的数量
  超级列表框1.置标题 (表项索引, 5, 正则回答时间.取子匹配文本 (局_计次, 1)) ' 回答的时间
.计次循环尾 ()
按钮_搜索.标题 = “搜索答案”
.子程序 _超级列表框1_被双击, 逻辑型
.参数 横向位置, 整数型
.参数 纵向位置, 整数型
.参数 功能键状态, 整数型
_预览此内容_被选择 ()
.子程序 _预览此内容_被选择
.如果真 (信息框 (_启动窗口.超级列表框1.取标题 (_启动窗口.超级列表框1.现行选中项, 2) + #换行符 + “-------------------------------” + #换行符 + “是否浏览更多回答?”, #是否钮 + #询问图标, 超级列表框1.取标题 (超级列表框1.现行选中项, 1)) = #是钮)
  _打开此链接_被选择 ()
.如果真结束
.子程序 _超级列表框1_鼠标右键被按下, 逻辑型
.参数 横向位置, 整数型
.参数 纵向位置, 整数型
.参数 功能键状态, 整数型
.如果真 (超级列表框1.取表项数 () ≠ 0)
  弹出菜单 (菜单, , )
.如果真结束
.子程序 _打开此链接_被选择
网页_打开指定网址 (超级列表框1.取标题 (超级列表框1.现行选中项, 4))
.子程序 _复制回答_被选择
.如果真 (置剪辑板文本 (超级列表框1.取标题 (超级列表框1.现行选中项, 2)) = 真)
  信息框 (“成功复制!”, #信息图标, “复制成功”)
.如果真结束
.子程序 __启动窗口_创建完毕
页码变量 = 0
编辑框_搜索内容.获取焦点 ()
.子程序 _复制此链接_被选择
.如果真 (置剪辑板文本 (超级列表框1.取标题 (超级列表框1.现行选中项, 4)) = 真)
  信息框 (“成功复制!”, #信息图标, “复制成功”)
.如果真结束
.子程序 _编辑框_搜索内容_内容被改变
.如果真 (编辑框_搜索内容.内容 = “”)
  页码变量 = 0
.如果真结束
.子程序 _编辑框_搜索内容_按下某键, 逻辑型
.参数 键代码, 整数型
.参数 功能键状态, 整数型
.如果真 (键代码 = #回车键)
  _按钮_搜索_被单击 ()
.如果真结束
.子程序 _获取更多回答_被选择
网页_打开指定网址 (“http://zhidao.baidu.com/search?word=” + 编码_URL编码 (搜索的内容) + “&ie=gbk&site=-1&sites=0&date=0&pn=0”)
.子程序 _按钮_关闭_被单击
结束 ()
.子程序 _按钮_获取更多回答_被单击
_获取更多回答_被选择 ()

运行结果:

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对我们的支持。如果你想了解更多相关内容请查看下面相关链接

(0)

相关推荐

  • 易语言输入QQ号查看头像的代码

    输入QQ号码,查看QQ头像 .版本 2 .支持库 internet .程序集 窗口程序集1 .子程序 _按钮确定_被单击 QQ头像图片框.图片 = HTTP读文件 ("http://q.qlogo.cn/headimg_dl?dst_uin=" + 编辑框账号.内容 + "&spec=640&img_type=jpg") 运行结果: 总结 以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对我们的支持.如

  • 易语言制作方言版语音合成工具

    麦霸传说语音合成专家 此功能需要加载讯飞云语音模块 .版本 2 .支持库 exui .支持库 iext .程序集 窗口程序集_启动窗口 .程序集变量 音乐, 文本型 .子程序 __启动窗口_创建完毕 云语音_初始化 ("dev.voicecloud.cn:80/index.htm", "5476b55d", "10000", "speex.dll", "2048") 时钟1.时钟周期 = 100 组合框_语

  • 易语言用画板制作围猫游戏的源码

    DLL命令表 .版本 2 .DLL命令 系统关于对话框, , , "ShellAboutA" .参数 窗口句柄, 整数型 .参数 应用程序标题, 文本型 .参数 其他信息, 文本型 .参数 图标句柄, 整数型 图片资源表 .版本 2 .图片 圆点白色 .图片 圆点猫 .图片 圆点墙 .图片 圆点叉 围猫游戏 .版本 2 .程序集 窗口程序集_启动窗口 .程序集变量 圆点状态, 整数型, , "121", 0空白1围墙2陷阱 .程序集变量 猫位置, 整数型 .程序集变

  • 易语言实现QQ全自动批量点赞功能

    利用模拟操作的方式实现QQ全自动点赞 此功能需要加载精易模块 .版本 2 .支持库 iext .支持库 HtmlView .支持库 spec .程序集 窗口程序集1 .程序集变量 停止变量, 逻辑型 .子程序 __启动窗口_创建完毕 ' 不允许多个QQ登录,不然每次需要手动选择点赞的号 .子程序 _导入按钮_被单击 .局部变量 分割文本, 文本型, , "0" .局部变量 文本, 文本型 .局部变量 i1, 整数型 .局部变量 索引, 整数型 通用对话框1.初始目录 = 取运行目录 (

  • 易语言制作欢乐斗牛单机版游戏源码

    DLL命令表 .版本 2 .DLL命令 复制内存_复制位图信息头到字节集, , , "RtlMoveMemory" .参数 Dest, 字节型, 传址 .参数 Src, BITMAPINFOHEADER .参数 len, 整数型 .DLL命令 复制内存_复制位图文件头到字节集, , , "RtlMoveMemory" .参数 Dest, 字节型, 传址 .参数 Src, 文件头信息_ .参数 len, 整数型 .DLL命令 复制内存_字节集到字节集, , , &qu

  • 易语言高精度完美延时的源码

    DLL命令表 .版本 2 .DLL命令 QueryPerformanceCounter, 整数型, "kernel32", "QueryPerformanceCounter", , 获取计数值 .参数 lpPerformanceCount, LARGE_INTEGER .DLL命令 QueryPerformanceFrequency, 整数型, "kernel32", "QueryPerformanceFrequency",

  • 易语言制作屏幕右下角弹出窗口的源码

    屏幕右下角广告 .版本 2 .程序集 窗口程序集1 .程序集变量 伸缩判断, 逻辑型 .子程序 __启动窗口_创建完毕 .子程序 _时钟1_周期事件 .如果 (伸缩判断 = 真) .如果真 (窗口1.顶边 > 取屏幕高度 () - 窗口1.高度 - 30) 窗口1.移动 (, 窗口1.顶边 - 1, , ) .如果真结束 .否则 .如果真 (窗口1.顶边 < 取屏幕宽度 ()) 窗口1.移动 (, 窗口1.顶边 + 1, , ) .如果真结束 .如果结束 .子程序 _按钮_关闭_被单击 伸缩判

  • 易语言软件版本更新检测工具源码

    软件版本更新检测工具 .版本 2 .支持库 internet .程序集 窗口程序集1 .子程序 __启动窗口_创建完毕 .子程序 _时钟1_周期事件 标签_最新版本.标题 = 到文本 (HTTP读文件 ("//www.jb51.net/软件更新链接.html")) ' 自己软件更新的地址 .子程序 _按钮_检测_被单击 .判断开始 (标签_最新版本.标题 ≠ 标签_当前版本.标题) 信息框 ("请到官方网站下载最新版本!", 0, , ) .默认 信息框 (&quo

  • 易语言制作酷狗付费音乐解析下载工具

    常量数据表 .版本 2 .常量 常量2, "<文本长度: 7>", , "url":" .常量 常量1, "<文本长度: 1>", , " 酷狗音乐直链解析 歌曲哈希值在酷狗音乐属性里可以找到. .版本 2 .支持库 internet .程序集 窗口程序集1 .子程序 _解析按钮_被单击 编辑框_直链.内容 = 获取MP3地址 (编辑框_哈希值.内容) .子程序 获取MP3地址, 文本型 .参数 has

  • 易语言删除注册项工具

    删除注册项 .版本 2 .程序集 窗口程序集1 .子程序 _按钮_删除注册项_被单击 删除注册项 (#本地机器, "software\microsoft\windows\CurrentVersion\Run\kiss770.cn") 删除注册项 (4, "SOFTWARE\360Safe\safemon\ExecAccess") 删除注册项 (4, "SOFTWARE\360Safe\safemon\MonAccess") 删除注册项 (4, &

  • 易语言制作王校长吃热狗游戏的源码

    王校长吃热狗游戏 .版本 2 .支持库 iext2 .支持库 OPenGL .支持库 spec .支持库 EThread .程序集 窗口程序集_启动窗口 .程序集变量 人物标识, 整数型 .程序集变量 热狗标识, 整数型, , "0" .程序集变量 死亡, 逻辑型 .程序集变量 得分, 整数型 .子程序 _开始按钮_被单击 动画物体2.图片 = #人物 人物标识 = 动画框1.创建物体 (动画物体2, 取鼠标水平位置 () - _启动窗口.左边 - 25, 取鼠标垂直位置 () - _

  • 易语言调用接口来实现机器人聊天的功能

    常量数据表 .版本 2 .常量 常量1, "<文本长度: 41>", , AI [现行时间]: Hi俺寂寞空虚冷 陪陪俺吧 .常量 常量2, "<文本长度: 25>", , 我 [现行时间]: [内容] .常量 常量3, "<文本长度: 24>", , AI [现行时间]: [内容] .常量 常量4, "<文本长度: 8>", , "text":"

  • 易语言制作汽车油耗计算器的代码

    汽车油耗计算器 .版本 2 .程序集 窗口程序集_启动窗口 .子程序 _计算按钮_被单击 .局部变量 公里, 双精度小数型 .局部变量 油量, 双精度小数型 .局部变量 油价, 双精度小数型 .局部变量 每公路价格, 双精度小数型 .局部变量 百公里油耗, 双精度小数型 .局部变量 每公升油路程, 双精度小数型 .如果真 (编辑框_公里.内容 = "" 或 编辑框_油箱.内容 = "" 或 编辑框_油价.内容 = "") 信息框 ("信

  • 易语言关于程序进程和线程的基础知识

    程序是计算机指令的集合,它以文件的形式存储在磁盘上. 进程:通常被定义为一个正在运行的程序的实例,是一个程序在其自身的地址空间中的一次执行活动. 进程是资源申请.调度和独立运行的单位,因此,它使用系统中的运行资源:而程序不能申请系统资源,不能被系统调度,也不能作为独立运行的单位,因此,它不占用系统的运行资源. 进程由两个部分组成: 1.操作系统用来管理进程的内核对象.内核对象也是系统用来存放关于进程的统计信息的地方. 2.地址空间.它包含所有可执行模块或DLL模块的代码和数据.它还包含动态内存分

  • 易语言领取QQ名片赞

    领取QQ名片赞 .版本 2 .支持库 HtmlView .支持库 spec .程序集 窗口程序集_启动窗口 .子程序 _按钮_领取名片赞_被单击 超文本浏览框1.跳转 ("http://api.qq-q.cc/mpz.php?url=http://jb51.net/&tid=154&mm=10000&qq=" + 号码编辑框.内容, , ) 状态编辑框.内容 = "接口1已领取" 延迟 (5000) 超文本浏览框1.跳转 ("htt

随机推荐