Java 如何获取url地址文件流

目录
  • 获取url地址文件流
  • 根据url获取文件的二进制
    • 上代码

获取url地址文件流

/**
 * 根据url下载文件流
 * @param urlStr
 * @return
 */
public static InputStream getInputStreamFromUrl(String urlStr) {
    InputStream inputStream=null;
    try {
        //url解码
        URL url = new URL(java.net.URLDecoder.decode(urlStr, "UTF-8"));
        HttpURLConnection conn = (HttpURLConnection) url.openConnection();
        //设置超时间为3秒
        conn.setConnectTimeout(3 * 1000);
        //防止屏蔽程序抓取而返回403错误
        conn.setRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)");
        //得到输入流
        inputStream = conn.getInputStream();
    } catch (IOException e) {

    }
    return inputStream;
}

根据url获取文件的二进制

当需要获取url的文件,又不想下载文件的时候,可以用这个工具类。

方便快捷,使用HttpURLConnection,先根据URL获取文件流,然后把获取的二进制流存储进去数据库即可,到时候拿出来直接下载、打开也是OK的。

上代码

package jd_test;
import java.io.BufferedReader;
import java.io.ByteArrayOutputStream;
import java.io.File;
import java.io.FileOutputStream;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;
import java.util.Base64;
import java.util.Random;
import java.util.stream.Stream;

public class UrlResource {
	 private static Base64.Decoder decoder = Base64.getDecoder();
	 private static Base64.Encoder encoder = Base64.getEncoder();
	public static void main(String[] args){
		try {
			//System.out.println(UrlResource.getUrlDetail("http://www.baidu.com",true));
			//saveUrlFile("你的文档的路径.gif", "D:\\1.gif");

			System.out.println(encoder.encode(getUrlFileData("http://www.你的文档的路径")));
		  // System.out.println(getUrlFileData("http://www.你的文档的路径"));
		   // saveUrlFile("http://www.你的文档的路径", "D:\\1.pdf");
		  //  System.out.println(UrlResource.getUrlDetail("http://www.你的文档的路径",true)); 

			//确定写出文件的位置
			File file = new File("D:\\1.pdf");
			//建立输出字节流
			FileOutputStream fos = new FileOutputStream(file);

			//fos.write(decoder.decode(encoder.encode(getUrlFileData("http://www.你的文档的路径"))));
			//fos.write(encoder.encode(getUrlFileData("http://www.你的文档的路径")));
			fos.write(getUrlFileData("http://www.你的文档的路径"));

			//用FileOutputStream 的write方法写入字节数组
			//fos.write(getUrlFileData("http://www.你的文档的路径"));
			System.out.println("写入成功");
			//为了节省IO流的开销,需要关闭
			fos.close();
		} catch (Exception e) {
			e.printStackTrace();
		}
	} 

	//获取网络文件,转存到fileDes中,fileDes需要带文件后缀名
	public static void saveUrlFile(String fileUrl,String fileDes) throws Exception
	{
		File toFile = new File(fileDes);
		if (toFile.exists())
		{
		// throw new Exception("file exist");
		return;
		}
		toFile.createNewFile();
		FileOutputStream outImgStream = new FileOutputStream(toFile);
		System.out.println(getUrlFileData(fileUrl));
		outImgStream.write(getUrlFileData(fileUrl)); 

		outImgStream.close();
	} 

	public static byte[] getBase64UrlFileData(String fileUrl)
	{
		try {

			//发票PDF文件二进制流base64,如果是get请求还需要进行UrlEncode,使用sdk除外。
			return encoder.encode(getUrlFileData(new String(decoder.decode(fileUrl))));
		} catch (Exception e) {
			e.printStackTrace();
		}
			return null;
		}
	//获取链接地址文件的byte数据
	public static byte[] getUrlFileData(String fileUrl) throws Exception
	{
		URL url = new URL(fileUrl);
		HttpURLConnection httpConn = (HttpURLConnection) url.openConnection();
		httpConn.connect();
		InputStream cin = httpConn.getInputStream();
		ByteArrayOutputStream outStream = new ByteArrayOutputStream();
		byte[] buffer = new byte[1024];
		int len = 0;
		while ((len = cin.read(buffer)) != -1) {
		outStream.write(buffer, 0, len);
		}
		cin.close();
		byte[] fileData = outStream.toByteArray();
		outStream.close();
		return fileData;
	} 

	//获取链接地址的字符数据,wichSep是否换行标记
	public static String getUrlDetail(String urlStr,boolean withSep) throws Exception
	{
	URL url = new URL(urlStr);
	HttpURLConnection httpConn = (HttpURLConnection)url.openConnection();
	httpConn.connect();
	InputStream cin = httpConn.getInputStream();
	BufferedReader reader = new BufferedReader(new InputStreamReader(cin,"UTF-8"));
	StringBuffer sb = new StringBuffer();
	String rl = null;
	while((rl = reader.readLine()) != null)
	{
		if (withSep)
		{
			sb.append(rl).append(System.getProperty("line.separator"));
		}
		//如果是要直接显示到页面中,可以讲获得的byte数据进行base64加密,加上文件头,直接设置到img的src里面就可以了
		else
		{
			sb.append(rl);
		}
	}
		return sb.toString();
	}
}

以上为个人经验,希望能给大家一个参考,也希望大家多多支持我们。

(0)

相关推荐

  • Java 获取URL的内容

    Java获取URL内容的,我这里只给出GET方式的,POST和其它方式的都是比较类似的.其技术要点就一下三点. 第一:创建HttpURLConnection 第二:打开URL,创建一个InputStream 第三:逐行(逐字节)读取,如果需要,转换编码,放入字符串. 好,一下就开始代码吧: 复制代码 代码如下: public String getUrlContent(String path){ String rtn = ""; int c; try{ java.net.URL l_ur

  • java通过url读取文件内容示例

    复制代码 代码如下: using System;  using System.Collections;  using System.ComponentModel;  using System.Data;  using System.Drawing;  using System.Web;  using System.Web.SessionState;  using System.Web.UI;  using System.Web.UI.WebControls;  using System.Web.

  • Java 必知必会的 URL 和 URLConnection使用

    java.net.URL 类将 URL 地址进行了封装,并提供了解析 URL 地址的基本方法,比如获取 URL 的主机名和端口号. java.net.URLConnection 则代表了应用程序和 URL 之间的通信链接,可用于读取和写入此 URL 引用的资源. URLConnection 看起来只是比 URL 多了一个 Connection,它们之间的关系也仅限于此吗? 01.什么是 URL 为了搞清楚什么是 URL,需要引入另外两个概念 URI 和 URN. 什么鬼,URL 都没搞清楚,又来

  • java通过url读取远程数据并保持到本地的实例代码

    前几天老姐突然告诉我,她在JD上买了本电子图书,如何买完发现,只能在线或者使用它自己的阅读器看,很不方便,让我给想想办法. 如何我就开始琢磨,最开始,我直接使用Acrobat Reader打开,发现只有目录,没有其他,而且页面上面的都存在,我想可能在正确的内容上增加了一块蒙版,只能用"钥匙"的人可以过滤它,要破解别人的编辑器,短时间肯定是不行的的,网上也有很多人想到的是使用自动化脚本去自动对官方阅读器截图,但是我发现,截图不是一页一页的,这就很懵逼了.最后只能通过在线阅读这条线来想办法

  • Java 如何获取url地址文件流

    目录 获取url地址文件流 根据url获取文件的二进制 上代码 获取url地址文件流 /** * 根据url下载文件流 * @param urlStr * @return */ public static InputStream getInputStreamFromUrl(String urlStr) { InputStream inputStream=null; try { //url解码 URL url = new URL(java.net.URLDecoder.decode(urlStr,

  • JAVA+Struts2获取服务器地址的方法

    本文实例讲述了JAVA+Struts2获取服务器地址的方法.分享给大家供大家参考.具体实现方法如下: 复制代码 代码如下: HttpServletRequest request=ServletActionContext.getRequest();  String path=request.getRequestURI();  String actionPath=".."+path.substring(9);  //访问服务器所带有的参数信息  String queryInfo=reque

  • PHP实现获取url地址中顶级域名的方法示例

    本文实例讲述了PHP实现获取url地址中顶级域名的方法.分享给大家供大家参考,具体如下: parse_url()获取到的host时多级域名,如:mp.weixin.qq.com.做域名黑名单的时候我们需要得到顶级域名. 有不足之处还请留言指正,谢谢. <?php /** * @Author: Ding Jianlong * @Date: 2019-03-07 16:14:04 * @Last Modified by: Ding Jianlong * @Last Modified time: 20

  • Java如何获取指定目录文件列表

    最近项目中会动态生成文件html及相关资源文件(css,js,png,mp3),为了防止文件名重复,需要获取目录中相同类型文件的最大编号,下面我用代码来实现获得文件列表. public static void getFiles(String path) { File file = new File(path); // 如果这个路径是文件夹 if (file.isDirectory()) { // 获取路径下的所有文件 File[] files = file.listFiles(); for (i

  • Java/Android 获取网络重定向文件的真实URL的示例代码

    前言: 今天在测试使用第三方提供的URL进行文件下载的时候,得到了一个被重定向的url.很不幸的是这个URL对于我来说没办法进行文件下载.这时候就需要获得重定向文件的真实URL. 问题分析 : 其实Java 使用HttpURLConnection下载的的时候,会自动下载重定向后的文件,但是我们无法获知目标文件的真实文件名,文件类型,用下面的方法可以得到真实的URL 解决方案 : 需要注意的是在Android 4.0之后网络请求不能在主线程执行 new Thread(new Runnable()

  • 获取URL地址中的文件名和参数的javascript代码

    复制代码 代码如下: //获取页面文件名 function GetPageName() { var url=window.location.href;//获取完整URL var tmp= new Array();//临时变量,保存分割字符串 tmp=url.split("/");//按照"/"分割 var pp = tmp[tmp.length-1];//获取最后一部分,即文件名和参数 tmp=pp.split("?");//把参数和文件名分割开

  • java正则表达式获取url的host示例

    复制代码 代码如下: public static String getHost(String url){  if(url==null||url.trim().equals("")){   return "";  }  String host = "";  Pattern p =  Pattern.compile("(?<=//|)((\\w)+\\.)+\\w+");  Matcher matcher = p.match

  • Java利用ip2region实现获取IP地址详情

    最近有个需求是通过ip地址获取地址详情,没有弄过相关的接口,通过查资料搞定之后赶紧记录分享一下 一开始我是通过api的方法获取但是总是报错获取不到所以改用了ip2region离线ip解析的方法获取的,废话不多说看操作. 首先要下载ip2region.db 下载地址:百度网盘 请输入提取码​​​​​​ 提取码:vik5 配置依赖 <dependency> <groupId>org.lionsoul</groupId> <artifactId>ip2region

  • PHP URL地址获取函数代码(端口等) 推荐

    php 获得当前的脚本网址(只有路径) 复制代码 代码如下: function GetCurUrl() { if(!empty($_SERVER["REQUEST_URI"])) { $scrtName = $_SERVER["REQUEST_URI"]; $nowurl = $scrtName; } else { $scrtName = $_SERVER["PHP_SELF"]; if(empty($_SERVER["QUERY_ST

  • php 获取完整url地址

    主要是获取到地址栏的一些信息,域名,端口参数等 复制代码 代码如下: <?php //获取域名或主机地址 echo $_SERVER['HTTP_HOST']."<br>"; //获取网页地址 echo $_SERVER['PHP_SELF']."<br>"; //获取网址参数 echo $_SERVER["QUERY_STRING"]."<br>"; //来源网页的详细地址 echo

随机推荐