Java 将Word转为HTML的方法

本文介绍如何在JAVA程序中将Word文档通过Document.saveToFile()方法转换为HTML文档。编辑代码前,参考如下环境配置,导入jar包。

【程序环境】

1. IntelliJ IDEA 2018( jdk 1.8.0)

2. 测试文档:Word 2013(.docx)

3. Jar包:Free Spire.Doc for Java 3.9.0

导入jar的两种方法:

方法1:下载jar包到本地,解压,将本地lib文件夹下的Spire.Doc.jar导入Java程序,步骤如下:

导入结果:

方法2:maven程序中需要配置pom.xml文件,指定maven仓库路径和spire.doc.free的依赖,配置内容如下:

<repositories>
        <repository>
            <id>com.e-iceblue</id>
            <url>http://repo.e-iceblue.cn/repository/maven-public/</url>
        </repository>
    </repositories>

<dependencies>
    <dependency>
        <groupId>e-iceblue</groupId>
        <artifactId>spire.doc.free</artifactId>
        <version>3.9.0</version>
    </dependency>
</dependencies>

【Java】

import com.spire.doc.*;

public class WordtoHtml {
    public static void main(String[] args) {
        Document  doc = new Document();
        doc.loadFromFile("test.docx");
        doc.saveToFile("wordtohtml.html",FileFormat.Html);
        doc.dispose();
    }
}

转换效果

Word测试文档:

转换后的HTML文件:

注:代码中的文件路径为IDEA程序项目文件夹路径,如 F:\IDEAProject\Conversion_Doc\test.docx ,文件路径可以另行自定义为其他路径。

到此这篇关于Java 将Word转为HTML的方法的文章就介绍到这了,更多相关Java Word转HTML内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • java实现word文件转html文件

    最近在项目开发中用户提出要在电脑上没有装office时在浏览器中打开word文件,最后确定的逻辑:用户选择想要查看的文件,页面js判断文件是否为word.不是执行下载,是后端根据word文件后缀访问对应转换方法.文件已存在对应html文件直接返回html文件地址,不存在先生成对应html文件再返回地址.js直接通过open()打开新的页签,展示word文件内容.新人一枚,如果代码中存在错误或有更好的实现万望指正! 相关jar包 代码 import java.io.ByteArrayOutputS

  • java实现在线预览--poi实现word、excel、ppt转html的方法

    java实现在线预览 - -之poi实现word.excel.ppt转html,具体内容如下所示: ###简介 java实现在线预览功能是一个大家在工作中也许会遇到的需求,如果公司有钱,直接使用付费的第三方软件或者云在线预览服务就可以了,例如永中office.office web 365(http://www.officeweb365.com/)他们都有云在线预览服务,就是要钱0.0 如果想要免费的,可以用openoffice,还需要借助其他的工具(例如swfTools.FlexPaper等)才

  • Java实现将word转换为html的方法示例【doc与docx格式】

    本文实例讲述了Java实现将word转换为html的方法.分享给大家供大家参考,具体如下: public static void main(String[] args) throws Exception { String filePath = "C:/Users/Administrator/Desktop/92个诊疗方案及临床路径/"; File file = new File(filePath); File[] files = file.listFiles(); String nam

  • java使用POI实现html和word相互转换

    项目后端使用了springboot,maven,前端使用了ckeditor富文本编辑器.目前从html转换的word为doc格式,而图片处理支持的是docx格式,所以需要手动把doc另存为docx,然后才可以进行图片替换. 一.添加maven依赖 主要使用了以下和poi相关的依赖,为了便于获取html的图片元素,还使用了jsoup: <dependency> <groupId>org.apache.poi</groupId> <artifactId>poi&

  • Java实现Word/Pdf/TXT转html的实例代码

    引言: 最近公司在做一个教育培训学习及在线考试的项目,本人主要从事网络课程模块,主要做课程分类,课程,课件的创建及在线学习和统计的功能,因为课件涉及到多种类型,像视频,音频,图文,外部链接及文档类型.其中就涉及到一个问题,就是文档型课件课程在网页上的展示和学习问题,因为要在线统计学习的课程,学习的人员,学习的时长,所以不能像传统做法将文档下载到本地学习,那样就不受系统控制了,所以最终的方案是,在上传文档型课件的时候,将其文件对应的转换成HTML文件,以便在网页上能够浏览学习 下边主要针对word

  • Java实现Word/Pdf/TXT转html的示例

    引言: 最近公司在做一个教育培训学习及在线考试的项目,本人主要从事网络课程模块,主要做课程分类,课程,课件的创建及在线学习和统计的功能,因为课件涉及到多种类型,像视频,音频,图文,外部链接及文档类型.其中就涉及到一个问题,就是文档型课件课程在网页上的展示和学习问题,因为要在线统计学习的课程,学习的人员,学习的时长,所以不能像传统做法将文档下载到本地学习,那样就不受系统控制了,所以最终的方案是,在上传文档型课件的时候,将其文件对应的转换成HTML文件,以便在网页上能够浏览学习 下边主要针对word

  • Java使用poi将word转换为html

    使用poi将word转换为html,支持doc,docx,转换后可以保持图片.样式. 1.导入Maven包 <dependency> <groupId>org.apache.poi</groupId> <artifactId>poi</artifactId> <version>3.14</version> </dependency> <dependency> <groupId>org.a

  • Java 将Word转为HTML的方法

    本文介绍如何在JAVA程序中将Word文档通过Document.saveToFile()方法转换为HTML文档.编辑代码前,参考如下环境配置,导入jar包. [程序环境] 1. IntelliJ IDEA 2018( jdk 1.8.0) 2. 测试文档:Word 2013(.docx) 3. Jar包:Free Spire.Doc for Java 3.9.0 导入jar的两种方法: 方法1:下载jar包到本地,解压,将本地lib文件夹下的Spire.Doc.jar导入Java程序,步骤如下:

  • Java 将Excel转为SVG的方法

    1. 程序运行环境如下: 编译工具:IDEA JDK版本:1.8.0 Excel测试文档:.xlsx 2013 Excel工具jar包:free spire.xls.jar 3.9.1 2.关于如何导入jar包 方法1:手动下载jar包.解压,将文件路径:D:\...\Spire.Xls-FE_3.9.1\lib\Spire.Xls.jar中的文件导入Java程序(即本文中使用的方法). 方法2:Maven仓库下载导入.先在maven程序中配置pom.xml文件,如下内容: <repositor

  • Java 将Excel转为OFD格式(方法步骤)

    OFD是一种开放版式文档(Open Fixed-layout Document )的英文缩写,是我国国家版式文档格式标准.本文,通过Java后端程序代码展示如何将Excel转为OFD格式.方法步骤如下. 导入jar包 方法1:maven程序中,通过配置pom.xml导入,如下: <repositories> <repository> <id>com.e-iceblue</id> <url>https://repo.e-iceblue.cn/rep

  • C#实现Word转为PDF的方法

    这里主要提供一种将word文档转成PDF文档的实现: 具体实现看c#代码:要引入Microsoft.Office.Interop.Word;版本12.0.0.0 using System; using System.Collections.Generic; using System.IO; using System.Linq; using System.Text; using System.Runtime.InteropServices; using Microsoft.Office.Inter

  • Java将Word文件转为OFD文件

    目录 前言 1. Maven仓库下载导入. 2. 手动导入. 将Word转为OFD 结语 前言 通常在工作中比较常用到的Microsoft Word是属于国外的文档内容编辑软件,其编译技术均属国外.而OFD是一种我国的自主文档格式,在某些特定行业或企业的文档存储技术上是一种更为安全的选择.下面将以Java代码示例介绍如何将Word文档转换为OFD格式. Java代码环境 Intelli IDEA Spire.Doc for Java 4.12.1 Word文档 两种方法可在Java程序中导入ja

  • Java实现Word/Excel/TXT转PDF的方法

    引言: 前段时间公司做的教育系统,系统需要实时记录用户学习课程的情况和时间,所以对一些除视频课程之外,对一些文本文档型课件同样如此,初次的方案是讲office相关类型的文件进行转换Html文件,然后展示对应的html文件,PC端差不多没问题了,但是个别文件再转换html之后,样式出现了错乱,即时做了编码转换处理,但是还是有个别乱码,最后改变方案,最后统一将文件转为pdf,然后通过流的方式在前端展示,其中包括Word Excel PPT TXT PDF等文件,代码如下: 备注:本来是可以直接展示p

  • Java实现HTML转为Word的示例代码

    本文以Java代码为例介绍如何实现将HTML文件转为Word文档(.docx..doc).在实际开发场景中可参考此方法来转换.下面详细方法及步骤. 在编辑代码前,请先在程序中导入Spire.Doc.jar,导入方法如下: 方法1 将Free Spire.Doc for Java包下载到本地,解压,找到lib文件夹下的Spire.Doc.jar文件.然后在IDEA中打开“Project Structure”界面,然后执行如图步骤来手动导入本地路径下的jar文件: 方法2 通过Maven仓库下载导入

  • Java实现PDF转为Word文档的示例代码

    目录 代码编译环境 将 PDF 转换为固定布局的 Doc/Docx 文档 完整代码 将 PDF 转换为流动形态的 Doc/Docx 文档 完整代码 效果图 众所周知,PDF文档除了具有较强稳定性和兼容性外, 还具有较强的安全性,在工作中可以有效避免别人无意中对文档内容进行修改.但与此同时,也妨碍了对文档的正常的修改.这时我们可以将PDF转为Word文档进行修改或再编辑.使用软件将 PDF 文档转换为 Word 文档十分简单,然而要在转换时保持布局甚至字体格式却并不容易.本文将分为以下两部分介绍如

  • php实现将上传word文件转为html的方法

    本文实例讲述了php实现将上传word文件转为html的方法.分享给大家供大家参考.具体实现方法如下: 上传页面: <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml

  • Java解析word,获取文档中图片位置的方法

    前言(背景介绍): Apache POI是Apache基金会下一个开源的项目,用来处理office系列的文档,能够创建和解析word.excel.ppt格式的文档. 其中对word文档的处理有两个技术,分别是HWPF(.doc)和XWPF(.docx).如果你对这两个技术熟悉的话,就应该能明白使用java解析word文档的痛楚所在. 其中两个最大的问题在于: 第一是这两个类并没有统一的父类和接口(隔壁的XSSF和HSSF投过来鄙视的眼光),所以没法进行同一格式的接口式编程: 第二是官方API中并

随机推荐