Java 将Word转为HTML的方法

本文介绍如何在JAVA程序中将Word文档通过 Document.saveToFile() 方法转换为HTML文档。编辑代码前,参考如下环境配置,导入jar包。

【程序环境】

1. IntelliJ IDEA 2018( jdk 1.8.0)

2. 测试文档:Word 2013(.docx)

3. Jar包:Free Spire.Doc for Java 3.9.0

导入jar的两种方法:

方法1下载jar包到本地,解压,将本地lib文件夹下的Spire.Doc.jar导入Java程序,步骤如下:

 

 

 

导入结果:

 

方法2maven程序中需要配置pom.xml文件,指定maven仓库路径和spire.doc.free的依赖,配置内容如下:

复制代码
<repositories>
        <repository>
            <id>com.e-iceblue</id>
            <url>http://repo.e-iceblue.cn/repository/maven-public/</url>
        </repository>
    </repositories>

<dependencies>
    <dependency>
        <groupId>e-iceblue</groupId>
        <artifactId>spire.doc.free</artifactId>
        <version>3.9.0</version>
    </dependency>
</dependencies>
复制代码

【Java】

复制代码
import com.spire.doc.*;

public class WordtoHtml {
    public static void main(String[] args) {
        Document  doc = new Document();
        doc.loadFromFile("test.docx");
        doc.saveToFile("wordtohtml.html",FileFormat.Html);
        doc.dispose();
    }
}
复制代码

转换效果

Word测试文档:

 

转换后的HTML文件:

 

注:代码中的文件路径为IDEA程序项目文件夹路径,如 F:\IDEAProject\Conversion_Doc\test.docx ,文件路径可以另行自定义为其他路径。

 

—End—

 

posted @   E-iceblue  阅读(3008)  评论(6编辑  收藏  举报
编辑推荐:
· 一个奇形怪状的面试题:Bean中的CHM要不要加volatile?
· [.NET]调用本地 Deepseek 模型
· 一个费力不讨好的项目,让我损失了近一半的绩效!
· .NET Core 托管堆内存泄露/CPU异常的常见思路
· PostgreSQL 和 SQL Server 在统计信息维护中的关键差异
阅读排行:
· DeepSeek “源神”启动!「GitHub 热点速览」
· 我与微信审核的“相爱相杀”看个人小程序副业
· 上周热点回顾(2.17-2.23)
· 如何使用 Uni-app 实现视频聊天(源码,支持安卓、iOS)
· C# 集成 DeepSeek 模型实现 AI 私有化(本地部署与 API 调用教程)
历史上的今天:
2019-10-09 Java 添加超链接到Word文档
点击右上角即可分享
微信分享提示