使用jsoup解析html的table中的文本信息实例

jsoup是一个非常好用的html解析工具。使用时需要下载相应的jar包。

下面就是我使用jsoup解析html的表格的java源代码。

亲测可用!

public void parse(){
	String htmlStr = "<table id=kbtable >"
			+ "<tr> "
				+ "<td width=123>"
					+ "<div id=12>这里是要获取的数据1</div>"
					+ "<div id=13>这里是要获取的数据2</div>"
				+ "</td>"
				+ "<td width=123>"
					+ "<div id=12>这里是要获取的数据3</div>"
					+ "<div id=13>这里是要获取的数据4</div>"
				+ "</td>	"
			+ "</tr>"
			+ "</table>";
	Document doc = Jsoup.parse(htmlStr);
	// 根据id获取table
	Element table = doc.getElementById("kbtable");
	// 使用选择器选择该table内所有的<tr> <tr/>
	Elements trs = table.select("tr");
	//遍历该表格内的所有的<tr> <tr/>
	for (int i = 0; i < trs.size(); ++i) {
		// 获取一个tr
		Element tr = trs.get(i);
		// 获取该行的所有td节点
		Elements tds = tr.select("td");
		// 选择某一个td节点
		for (int j = 0; j < tds.size(); ++j) {
			Element td = tds.get(j);
			// 获取td节点的所有div
			Elements divs = td.select("div");
			// 选择一个div
			for (int k = 0; k < divs.size(); k++) {
				Element div = divs.get(k);
				//获取文本信息
				String text = div.text();
				//输出到控制台
				System.out.println(text);
			}
		}
	}
}

以上这篇使用jsoup解析html的table中的文本信息实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们。

(0)

相关推荐

  • Java中使用开源库JSoup解析HTML文件实例

    HTML是WEB的核心,互联网中你看到的所有页面都是HTML,不管它们是由JavaScript,JSP,PHP,ASP或者是别的什么WEB技术动态生成的.你的浏览器会去解析HTML并替你去渲染它们.不过如果你需要自己在Java程序中解析HTML文档并查找某些元素,标签,属性或者检查某个特定的元素是否存在的话,那又该如何呢?如果你已经使用Java编程多年了,我相信你肯定试过去解析XML,也使用过类似DOM或者SAX这样的解析器,不过很有可能你从未进行过任何的HTML解析的工作.更讽刺的是,在Jav

  • Jsoup解析HTML实例及文档方法详解

    解析和遍历一个HTML文档 如何解析一个HTML文档: 复制代码 代码如下: String html = "<html><head><title>First parse</title></head>"  + "<body><p>Parsed HTML into a doc.</p></body></html>";Document doc = Jso

  • Jsoup解析html实现招聘信息查询功能

    jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址.HTML 文本内容.它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据. 下面是招聘网站的html信息: <div class="newlist_list_content" id="newlist_list_content_table"> <table width="853" class=&

  • 使用jsoup解析html的table中的文本信息实例

    jsoup是一个非常好用的html解析工具.使用时需要下载相应的jar包. 下面就是我使用jsoup解析html的表格的java源代码. 亲测可用! public void parse(){ String htmlStr = "<table id=kbtable >" + "<tr> " + "<td width=123>" + "<div id=12>这里是要获取的数据1</div

  • Python使用get_text()方法从大段html中提取文本的实例

    如下所示: <textarea rows="" cols="" name="id"><DIV style="TEXT-INDENT: 18pt; mso-char-indent-count: 2.0000" class=MsoNormal><SPAN style="FONT-FAMILY: 宋体; FONT-SIZE: 9pt; mso-spacerun: 'yes'; mso-font

  • Vue 实现从文件中获取文本信息的方法详解

    本文实例讲述了Vue 实现从文件中获取文本信息的方法.分享给大家供大家参考,具体如下: 最近在使用vue做项目的时候,遇到一个需求,界面中需要显示大量的说明文字,为了保持界面的整洁和赶紧,决定采用单独的文件来存储显示信息,然后通过文件读取的方式显示到界面上. 刚开始我使用的是File和FileReader对象获取,但是比较气人的是这两个对象是IE浏览器特有的属性,chrome不支持,而且为了安全起见,现在浏览器是不推崇这种做法的,因为很容易造成文件被外部恶意删除或增加内容,安全性太低.无奈之下,

  • crawler4j抓取页面使用jsoup解析html时的解决方法

    crawler4j对已有编码的页面抓取效果不错,用jsoup解析,很多会jquery的程序员都可以操作.但是,crawler4j对response没有指定编码的页面,解析成乱码,很让人烦恼.在找了苦闷之中,无意间发现一年代已久的博文,可以解决问题,修改 Page.load() 中的 contentData 编码即可,这让我心中顿时舒坦了很多,接下来的问题都引刃而解了. 复制代码 代码如下: public void load(HttpEntity entity) throws Exception

  • js实现将json数组显示前台table中

    在最近的学习中遇到一个小问题,如何把JSON数组显示在前台的table中,经过一番借鉴和学习之后终于解决了这个问题.具体的代码如下: (前提:利用ajax获取过来的JSON字符串必须是规范的,这样才能解析正确.后台获取数据库中数据的代码省略了) 1.前台JS代码(使用之前引入JQuery的js库文件) $.ajax({ type: "GET", url: "UserList.ashx?Action=List",//利用ajax请求后台的并返回值 // data: &

  • Android开发之利用jsoup解析HTML页面的方法

    本文实例讲述了Android利用jsoup解析HTML页面的方法.分享给大家供大家参考,具体如下: 这节主要是讲解jsoup解析HTML页面.由于在android开发过程中,不可避免的涉及到web页面的抓取,解析,展示等等,所以,在这里我主要展示下利用jsoup jar包来抓取cnbeta.com网站的话题分类的实例. 下面是主要的代码,由于使用及其简单,我这里就不再多说了: package com.android.web; import java.io.BufferedInputStream;

  • Android使用Jsoup解析Html表格的方法

    本文实例讲述了Android使用Jsoup解析Html表格的方法.分享给大家供大家参考,具体如下: 看代码吧,可解析表中的label text button 自己根据需要再添加,呵呵 import java.util.ArrayList; import java.util.List; import org.apache.http.NameValuePair; import org.apache.http.message.BasicNameValuePair; import org.jsoup.J

随机推荐