C# 提取Word文档中的图片

C# 提取Word文档中的图片

图片和文字是word文档中两种最常见的对象,在微软word中,如果我们想要提取出一个文档内的图片,只需要右击图片选择另存为然后命名保存就可以了,今天这篇文章主要是实现使用C#从word文档中提取图片。

这里我准备了一个含有文字和图片的word文档:

                       

详细步骤与代码:

步骤1添加引用。

新建一个Visual C#控制台项目,添加引用并使用如下命名空间:

1
2
3
4
using System;
using Spire.Doc;
using Spire.Doc.Documents;
using Spire.Doc.Fields;

 

步骤2新建一个word文档对象并加载需要提取图片的word文档。

1
Document document = new Document("法国景点.docx ");

 

步骤3遍历文档中的所有section,找到图片,将它们提取出来并保存。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
int index = 0;
 
//获取文档的section
foreach (Section section in document.Sections)
{
    //获取section中的段落
    foreach (Paragraph paragraph in section.Paragraphs)
    {
        //获取段落中的文档对象
        foreach (DocumentObject docObject in paragraph.ChildObjects)
        {
            //对对象的type进行判断,如果是图片,就提取出来
            if (docObject.DocumentObjectType == DocumentObjectType.Picture)
            {
                DocPicture picture = docObject as DocPicture;
                //给图片命名
                String imageName = String.Format(@"images\Image-{0}.png", index);
                //保存图片
                picture.Image.Save(imageName, System.Drawing.Imaging.ImageFormat.Png);
                index++;
            }
        }
    }
}

 

提取出来的图片:

全部代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
using System;
using Spire.Doc;
using Spire.Doc.Documents;
using Spire.Doc.Fields;
using System.Drawing;
 
namespace Extract_image_from_word
{
    class Program
    {
        static void Main(string[] args)
        {
            Document document = new Document("法国景点.docx");
 
            int index = 0;
            foreach (Section section in document.Sections)
            {
                foreach (Paragraph paragraph in section.Paragraphs)
                {
                    foreach (DocumentObject docObject in paragraph.ChildObjects)
                    {
                        if (docObject.DocumentObjectType == DocumentObjectType.Picture)
                        {
                            DocPicture picture = docObject as DocPicture;
                            String imageName = String.Format(@"images\Image-{0}.png", index);
                            picture.Image.Save(imageName, System.Drawing.Imaging.ImageFormat.Png);
                            index++;
                        }
                    }
                }
            }
        }
    }
}

 

总结:

这里我使用的是E-iceblue公司的免费word组件,它除了可以从文档中提取图片,还可以提取文本,这里我只写了提取图片的,提取文本的也差不多,如有需要可以留言。

posted @   E-iceblue  阅读(5440)  评论(4编辑  收藏  举报
编辑推荐:
· 一个奇形怪状的面试题:Bean中的CHM要不要加volatile?
· [.NET]调用本地 Deepseek 模型
· 一个费力不讨好的项目,让我损失了近一半的绩效!
· .NET Core 托管堆内存泄露/CPU异常的常见思路
· PostgreSQL 和 SQL Server 在统计信息维护中的关键差异
阅读排行:
· DeepSeek “源神”启动!「GitHub 热点速览」
· 我与微信审核的“相爱相杀”看个人小程序副业
· 上周热点回顾(2.17-2.23)
· 如何使用 Uni-app 实现视频聊天(源码,支持安卓、iOS)
· C# 集成 DeepSeek 模型实现 AI 私有化(本地部署与 API 调用教程)
点击右上角即可分享
微信分享提示