Java预览PDF时的文件名称问题及解决
目录
- Java预览PDF时的文件名称
- 问题场景
- 解决思路
- 解决方案
- 预览pdf时中文乱码
- 第一步
- 第二步
Java预览PDF时的文件名称
问题场景
今天在做新项目的时候,测试提交过来一个bug:在谷歌浏览器上预览一些客户上传的pdf文件时,发现浏览器的标签上展示的要么不是我们看到的文件名,要么就直接是方法名,看起来不太合适,让我想想办法优化优化。
刚开始看到这个问题的时候确实很头疼,因为之前尝试过去解决这个问题,但是当时因为一些其他的原因,没有仔细的去思考这些个问题,这会做新项目刚好有时间去琢磨一下这个问题,
解决思路
看了一下一个有问题的PDF文件之后发现文件的名称和文件的属性名其实不一致,浏览器默认展示的是文件的属性名,而不是我们看到的文件名称
这也就让我定位到了问题的所在,出现这个bug的原因就是PDF文件的属性名称与文件名称不一致,
定位到问题之后就很好解决了
解决方案
从pdfbox的 官网文档 我们可以看到有一个静态方法专门用于将输入流解析为PDF文档,我们就是用这个方法来进行操作
接下来看代码
/** * 预览PDF文件 * * @param filePath * @param originFileName * @return void * @author ss.xin * @date 2021/2/5 9:27 */ private void viewPdfFile(String filePath, String originFileName) { File file = new File(filePath); try (OutputStream outputStream = response.getOutputStream(); //加载pdf附件到PDF流中 PDDocument document = PDDocument.load(new FileInputStream(file))) { response.setCharacterEncoding(Constant.UTF8); String showName = StringUtils.isNotBlank(originFileName) ? originFileName : file.getName(); showName = URLEncoder.encode(showName, Constant.UTF8); response.setHeader("Content-Disposition", "inline;fileName=" + showName + ";fileName*=UTF-8''" + showName); //从PDF流中获得PDF文档属性对象 PDDocumentInformation info = document.getDocumentInformation(); //设置PDF文档属性对象的文件名称(最重要的环节) info.setTitle(StringUtils.isNotBlank(originFileName) ? originFileName : file.getName()); document.setDocumentInformation(info); //修改完直接输出到响应体中 document.save(outputStream); } catch (Exception e) { log.error(this.getClass().getName() + ".viewPdfFile:", e); } }
设置完成之后,我们就可以看到在浏览器的页签上文件的名称已经正常了
至此,就达到了我们整个想要的一个效果。
预览pdf时中文乱码
项目在预览pdf时,中文乱码。
处理方式:
第一步
首先检查是否设置了 request.setCharacterEncoding(“UTF-8”);
和
response.setContentType(“application/pdf; charset=UTF-8”);
第二步
如果部署在win上没有乱码,部署在linux上有乱码,可能是在linux上面可能没有对应的字体,拷贝字体上去(我这个版本的字体不用安装),指定路径即可 FontSettings.setFontsFolder("/usr/share/fonts/", true);
如果有使用liberoffice,使用下面的方式:
liberoffice默认读取的时这个路径下的字体/usr/share/fonts,把字体拷贝导这个路径下面,chmod 777 * 进行授权,然后sudo fc-cache -fv刷新缓存,重启系统
以上为个人经验,希望能给大家一个参考,也希望大家多多支持我们。