Java 将Word转为HTML的方法
本文介绍如何在JAVA程序中将Word文档通过 Document.saveToFile() 方法转换为HTML文档。编辑代码前,参考如下环境配置,导入jar包。
【程序环境】
1. IntelliJ IDEA 2018( jdk 1.8.0)
2. 测试文档:Word 2013(.docx)
3. Jar包:Free Spire.Doc for Java 3.9.0
导入jar的两种方法:
方法1:下载jar包到本地,解压,将本地lib文件夹下的Spire.Doc.jar导入Java程序,步骤如下:
导入结果:
方法2:maven程序中需要配置pom.xml文件,指定maven仓库路径和spire.doc.free的依赖,配置内容如下:
<repositories> <repository> <id>com.e-iceblue</id> <url>http://repo.e-iceblue.cn/repository/maven-public/</url> </repository> </repositories> <dependencies> <dependency> <groupId>e-iceblue</groupId> <artifactId>spire.doc.free</artifactId> <version>3.9.0</version> </dependency> </dependencies>
【Java】
import com.spire.doc.*; public class WordtoHtml { public static void main(String[] args) { Document doc = new Document(); doc.loadFromFile("test.docx"); doc.saveToFile("wordtohtml.html",FileFormat.Html); doc.dispose(); } }
转换效果
Word测试文档:
转换后的HTML文件:
注:代码中的文件路径为IDEA程序项目文件夹路径,如 F:\IDEAProject\Conversion_Doc\test.docx ,文件路径可以另行自定义为其他路径。
—End—