C# WinForm开发系列 - Word

01. 在.NET应用程序中集成Microsoft Word

[翻译]
Anup Shinde著Integrating Microsoft Word in your .NET applications

[介绍]
本文解释如何在.NET应用程序中使用Word,它将介绍你如何在你的程序中使用最完美的文字编辑器。

[代码的使用]

推荐首先看一下最基础的文章

当我们在我们的程序中创建一个窗口的时候,我们不希望它的关闭按钮、最大化、最小化按钮还起作用。

集成Word

02. 将Word文档导入RichTextBox

03. 从Word 2007 DOCX文件中提取文字

翻译

Eugene Pankov.Using DocxToText to Extract Text from DOCX Files

简介

如今,微软已经转为使用基于XML格式存储文档内容了。这也给需要进行在Word文件(*.docx)搜索内容的程序员带来了一些小问题。当然,如 果在安装了Microsoft Office 2007的计算机上,是没什么问题的;但是,你的程序要是运行在没有Office的服务器上呢?

这里有三个选择:
1. 安装Microsoft Office 2007,并使用其DLL
2. 使用第三方的链接库,如"Office Open XML C# Library." 
3. 自己写代码.

事实上,你还有另外一个选择:就是使用本文的DocxToText。:)

DocxToText类

本类只有一个功能,那就是从*.docx文件中,提取出文字。不过,在我们深入了解其代码之前,我想提示一下,Microsoft Word *.docx文件是压缩成zip文档的XML文档,包含文字、类型、图像等等。因此,我们不得不对其进行解包。如果,你在使用.NET 3.0,你可以使用System.IO.Packaging空间的Package类。不过,我在这里用于.NET 2.0平台,所以,使用了一个开源的ZIP库SharpZipLib. http://www.icsharpcode.net/OpenSource/SharpZipLib/

如果你重新命名你的*.docx文件成*.zip文件,并打开这个zip文件,你就会见到下面的内容:

首先,我们必须读取[Content_Types].xml文件,从中找到document.xml文件。通常,Microsoft把它隐藏在/word子目录中,不过如果这个文档不是Microsoft Word创建的,它可能存在与文件的任何的地方。接下来,我们就可以匹配document.xml,从中提取出文本了。

本文的代码中的ReadNode()方法,实现了上面的工作:它提取出字符串、图像、tab和目录,并连接成最终的字符串。

04.  c# 实现Word联接Excel的MailMerge功能

05. 扩展GridView控件(8) - 导出数据源的数据为Excel、Word或Text

06. 开源代码系列之Office文档读写(Excel/Word)

07. 实用Word使用技巧大全

08. 关注VSTO,从C# 读取Word开始

09. 让IE浏览器提示下载或直接打开word文档

10. 使用jsp实现word、excel格式报表打印

11. .NET1.1下,使用C#自动生成Word2003文档(通过操作COM组件实现)

12. asp.net中生成word文件的问题。

13. 从ASP.NET得到Microsoft Word文档

14. WORD对话框打开时命令无法执行的解决方法

15. 在C#中利用自动化模型操纵Word

16. VS2003中基于Word2003编程

17. .NET操作Word(傻瓜型)

18. 操作Word文档的类(VB.NET)

19. C#实现Word中表格信息读取

20.  Visual Studio 2005 开发Office(Word/Excel)项目的若干资源和示例

21. 用Visual Studio .NET自动化MS Word(翻译)

22. C#实现对Word、Excel等的模版定制(转载)

23. C#实现Word中表格信息读取

24. 最近一直在做C#操作office方面的工作!总结一下!Word(二)

25. Office 中的 Word

posted @ 2010-03-12 20:21  与时俱进  阅读(1141)  评论(0编辑  收藏  举报
友情链接:同里老宅院民居客栈