java实现网页解析示例
只需将网址粘贴在第九行括号内即可
package com.meession.test;
import java.io.DataInputStream;
import java.net.URL;
public class Internet {
public static void main(String args[]){
URL myURL;
DataInputStream myURLContent;
try{
myURL=new URL("http://www.jb51.net");
myURLContent=new DataInputStream(myURL.openStream());
while(myURLContent.readLine() != null){
String Iline=myURLContent.readLine();
System.out.println(Iline);
}
myURLContent.close();
}
catch(Exception e){
System.out.println("Error");
}
}
}
相关推荐
-
java抓取网页数据示例
下面举例说明: 抓取百度首页的内容: 复制代码 代码如下: URL url = new URL("http://www.baidu.com");HttpURLConnection urlCon=(HttpURLConnection)url.openConnection();urlCon.setConnectTimeout(50000);urlCon.setReadTimeout(300000);DataInputStream fIn;byte[] content = new byte[
-
java简单网页抓取的实现方法
本文实例讲述了java简单网页抓取的实现方法.分享给大家供大家参考.具体分析如下: 背景介绍 一 tcp简介 1 tcp 实现网络中点对点的传输 2 传输是通过ports和sockets ports提供了不同类型的传输(例如 http的port是80) 1)sockets可以绑定在特定端口上,并且提供传输功能 2)一个port可以连接多个socket 二 URL简介 URL 是对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址. 互联网上的每个文件都有一个唯一的
-
java 抓取网页内容实现代码
复制代码 代码如下: package test; import java.io.BufferedReader; import java.io.IOException; import java.io.InputStream; import java.io.InputStreamReader; import java.net.Authenticator; import java.net.HttpURLConnection; import java.net.PasswordAuthentication
-
java抓取网页数据获取网页中所有的链接实例分享
效果图 复制代码 代码如下: import java.io.BufferedReader;import java.io.IOException;import java.io.InputStreamReader;import java.net.HttpURLConnection;import java.net.URL;import java.util.ArrayList;import java.util.regex.Matcher;import java.util.regex.Pattern; p
-
JAVA使用爬虫抓取网站网页内容的方法
本文实例讲述了JAVA使用爬虫抓取网站网页内容的方法.分享给大家供大家参考.具体如下: 最近在用JAVA研究下爬网技术,呵呵,入了个门,把自己的心得和大家分享下 以下提供二种方法,一种是用apache提供的包.另一种是用JAVA自带的. 代码如下: // 第一种方法 //这种方法是用apache提供的包,简单方便 //但是要用到以下包:commons-codec-1.4.jar // commons-httpclient-3.1.jar // commons-logging-1.0.4.jar
-
用javascrpt将指定网页保存为Excel的代码
function AllAreaExcel(ID) { var oXL = new ActiveXObject("Excel.Application"); var oWB = oXL.Workbooks.Add(); var oSheet = oWB.ActiveSheet; var sel=document.body.createTextRange(); sel.moveToElementText(ID); sel.select(); sel.execCommand("Co
-
Java用正则表达式如何读取网页内容
学习java的正则表达式,抓取网页并解析HTML部分内容 package com.xiaofeng.picup; import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.net.MalformedURLException; import java.net.URL; import java.util.ArrayList; import java.
-
java正则表达式匹配网页所有网址和链接文字的示例
复制代码 代码如下: import java.io.BufferedReader;import java.io.IOException;import java.io.InputStreamReader;import java.net.MalformedURLException;import java.net.URL;import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.
-
Java中使用正则表达式获取网页中所有图片的路径
/** * 从HTML源码中提取图片路径,最后以一个 String 类型的 List 返回,如果不包含任何图片,则返回一个 size=0 的List * 需要注意的是,此方法只会提取以下格式的图片:.jpg|.bmp|.eps|.gif|.mif|.miff|.png|.tif|.tiff|.svg|.wmf|.jpe|.jpeg|.dib|.ico|.tga|.cut|.pic * @param htmlCode HTML源码 * @return <img>标签 src 属性指向的图片地址的
-
Java获取任意http网页源代码的方法
本文实例讲述了JAVA获取任意http网页源代码.分享给大家供大家参考,具体如下: JAVA获取任意http网页源代码可实现如下功能: 1. 获取任意http网页的代码 2. 获取任意http网页去掉HTML标签的代码 Webpage类: /** * 网页操作相关类 */ package test; import java.io.BufferedReader; import java.io.InputStreamReader; import java.net.URL; import java.u
随机推荐
- VBS教程:VBscript语句-Dim 语句
- 修改flash之必备软件硕思闪客精灵3.3注册破解版下载
- Mybatis输入输出映射及动态SQL Review
- iOS中使用正则表达式NSRegularExpression 来验证textfiled输入的内容
- XenServer中VMware的Console的连接方法
- JS实现仿雅虎首页快捷登录入口及导航模块效果
- 基于JS实现简单的样式切换效果代码
- SqlCommandBuilder如何实现批量更新
- python绘图方法实例入门
- Python中比较特别的除法运算和幂运算介绍
- JSON字符串传到后台PHP处理问题的解决方法
- php 使用redis锁限制并发访问类示例
- Eclipse下编写java程序突然不会自动生成R.java文件和包的解决办法
- PHP反射机制原理与用法详解
- javaScript生成支持中文带logo的二维码(jquery.qrcode.js)
- jquery.bgiframe.js在IE9下提示INVALID_CHARACTER_ERR错误
- jquery预览图片实现鼠标放上去显示实际大小
- jQuery定义背景动态切换效果的方法
- JQuery日历插件My97DatePicker日期范围限制
- centos下安装配置phpMyAdmin的方法步骤