C# WinForm开发系列 - Word
01. 在.NET应用程序中集成Microsoft Word
[翻译]
Anup Shinde著Integrating Microsoft Word in your .NET applications
[介绍]
本文解释如何在.NET应用程序中使用Word,它将介绍你如何在你的程序中使用最完美的文字编辑器。
[代码的使用]
推荐首先看一下最基础的文章
当我们在我们的程序中创建一个窗口的时候,我们不希望它的关闭按钮、最大化、最小化按钮还起作用。
翻译
Eugene Pankov.著Using DocxToText to Extract Text from DOCX Files
简介
如今,微软已经转为使用基于XML格式存储文档内容了。这也给需要进行在Word文件(*.docx)搜索内容的程序员带来了一些小问题。当然,如 果在安装了Microsoft Office 2007的计算机上,是没什么问题的;但是,你的程序要是运行在没有Office的服务器上呢?
这里有三个选择:
1. 安装Microsoft Office 2007,并使用其DLL
2. 使用第三方的链接库,如"Office Open XML C# Library."
3. 自己写代码.
事实上,你还有另外一个选择:就是使用本文的DocxToText。:)
DocxToText类
本类只有一个功能,那就是从*.docx文件中,提取出文字。不过,在我们深入了解其代码之前,我想提示一下,Microsoft Word *.docx文件是压缩成zip文档的XML文档,包含文字、类型、图像等等。因此,我们不得不对其进行解包。如果,你在使用.NET 3.0,你可以使用System.IO.Packaging空间的Package类。不过,我在这里用于.NET 2.0平台,所以,使用了一个开源的ZIP库SharpZipLib. http://www.icsharpcode.net/OpenSource/SharpZipLib/
如果你重新命名你的*.docx文件成*.zip文件,并打开这个zip文件,你就会见到下面的内容:
首先,我们必须读取[Content_Types].xml文件,从中找到document.xml文件。通常,Microsoft把它隐藏在/word子目录中,不过如果这个文档不是Microsoft Word创建的,它可能存在与文件的任何的地方。接下来,我们就可以匹配document.xml,从中提取出文本了。
本文的代码中的ReadNode()方法,实现了上面的工作:它提取出字符串、图像、tab和目录,并连接成最终的字符串。
04. c# 实现Word联接Excel的MailMerge功能
05. 扩展GridView控件(8) - 导出数据源的数据为Excel、Word或Text
06. 开源代码系列之Office文档读写(Excel/Word)
07. 实用Word使用技巧大全
11. .NET1.1下,使用C#自动生成Word2003文档(通过操作COM组件实现)
13. 从ASP.NET得到Microsoft Word文档
17. .NET操作Word(傻瓜型)
19. C#实现Word中表格信息读取
20. Visual Studio 2005 开发Office(Word/Excel)项目的若干资源和示例
21. 用Visual Studio .NET自动化MS Word(翻译)
23. C#实现Word中表格信息读取
24. 最近一直在做C#操作office方面的工作!总结一下!Word(二)
25. Office 中的 Word