Asp.net中Word文件转换成HTML
最近在项目中使用到了一个Word转换为HTML的功能,于是自己写了一个示例,关键代码如下:
//存放word文件的完整路径
string wordPath = Server.MapPath("/word/test.doc");
//存放html文件的完整路径
string htmlPath = Server.MapPath("/html/test.html");
//上传word文件, 由于只是做示例,在这里不多做文件类型、大小、格式以及是否存在的判断
FileUpload1.SaveAs(wordPath);
#region 文件格式转换
//请引用Microsoft.Office.Interop.Word
ApplicationClass word = new ApplicationClass();
Type wordType = word.GetType();
Documents docs = word.Documents;
// 打开文件
Type docsType = docs.GetType();
object fileName = wordPath; //"f:\\cc.doc";
Document doc = (Document)docsType.InvokeMember("Open", BindingFlags.InvokeMethod, null, (object)docs, new Object[] { fileName, true, true });
//判断与文件转换相关的文件是否存在,存在则删除。(这里,最好还判断一下存放文件的目录是否存在,不存在则创建)
if (File.Exists(htmlPath)) { File.Delete(htmlPath); }
//每一个html文件,有一个对应的存放html相关元素的文件夹(html文件名.files)
if (Directory.Exists(htmlPath.Replace(".html", ".files")))
{
Directory.Delete(htmlPath.Replace(".html", ".files"), true);
};
//转换格式,调用word的“另存为”方法
Type docType = doc.GetType();
object saveFileName = htmlPath; //"f:\\aaa.html";
docType.InvokeMember("SaveAs", BindingFlags.InvokeMethod, null, doc, new object[] { saveFileName, WdSaveFormat.wdFormatHTML });
// 退出 Word
wordType.InvokeMember("Quit", BindingFlags.InvokeMethod, null, word, null);
#endregion
string wordPath = Server.MapPath("/word/test.doc");
//存放html文件的完整路径
string htmlPath = Server.MapPath("/html/test.html");
//上传word文件, 由于只是做示例,在这里不多做文件类型、大小、格式以及是否存在的判断
FileUpload1.SaveAs(wordPath);
#region 文件格式转换
//请引用Microsoft.Office.Interop.Word
ApplicationClass word = new ApplicationClass();
Type wordType = word.GetType();
Documents docs = word.Documents;
// 打开文件
Type docsType = docs.GetType();
object fileName = wordPath; //"f:\\cc.doc";
Document doc = (Document)docsType.InvokeMember("Open", BindingFlags.InvokeMethod, null, (object)docs, new Object[] { fileName, true, true });
//判断与文件转换相关的文件是否存在,存在则删除。(这里,最好还判断一下存放文件的目录是否存在,不存在则创建)
if (File.Exists(htmlPath)) { File.Delete(htmlPath); }
//每一个html文件,有一个对应的存放html相关元素的文件夹(html文件名.files)
if (Directory.Exists(htmlPath.Replace(".html", ".files")))
{
Directory.Delete(htmlPath.Replace(".html", ".files"), true);
};
//转换格式,调用word的“另存为”方法
Type docType = doc.GetType();
object saveFileName = htmlPath; //"f:\\aaa.html";
docType.InvokeMember("SaveAs", BindingFlags.InvokeMethod, null, doc, new object[] { saveFileName, WdSaveFormat.wdFormatHTML });
// 退出 Word
wordType.InvokeMember("Quit", BindingFlags.InvokeMethod, null, word, null);
#endregion
以上代码,在.net framework4.0 中,可能会出一编译错误:
无法嵌入互操作类型“……”,请改用适用的接口。
查阅资料,找到解决方案,记录如下:
选中项目中引入word的dll,鼠标右键,选择属性,把“嵌入互操作类型”设置为False。
下载源码:/Files/linyechengwei/WordToHTML.rar