如何使用C#从word文档中提取图片
图片和文字是word文档中两种最常见的对象,在微软word中,如果我们想要提取出一个文档内的图片,只需要右击图片选择另存为然后命名保存就可以了,今天这篇文章主要是实现如何使用C#从word文档中提取图片。
这里我准备了一个含有文字和图片的word文档:
详细步骤与代码:
步骤1 : 添加引用。
新建一个Visual C#控制台项目,添加引用并使用如下命名空间:
using System; using Spire.Doc; using Spire.Doc.Documents; using Spire.Doc.Fields;
步骤2 : 新建一个word文档对象并加载需要提取图片的word文档。
Document document = new Document("法国景点.docx ");
步骤3 : 遍历文档中的所有section,找到图片,将它们提取出来并保存。
int index = 0; //获取文档的section foreach (Section section in document.Sections) { //获取section中的段落 foreach (Paragraph paragraph in section.Paragraphs) { //获取段落中的文档对象 foreach (DocumentObject docObject in paragraph.ChildObjects) { //对对象的type进行判断,如果是图片,就提取出来 if (docObject.DocumentObjectType == DocumentObjectType.Picture) { DocPicture picture = docObject as DocPicture; //给图片命名 String imageName = String.Format(@"images\Image-{0}.png", index); //保存图片 picture.Image.Save(imageName, System.Drawing.Imaging.ImageFormat.Png); index++; } } } }
提取出来的图片:
全部代码:
using System; using Spire.Doc; using Spire.Doc.Documents; using Spire.Doc.Fields; using System.Drawing; namespace Extract_image_from_word { class Program { static void Main(string[] args) { Document document = new Document("法国景点.docx"); int index = 0; foreach (Section section in document.Sections) { foreach (Paragraph paragraph in section.Paragraphs) { foreach (DocumentObject docObject in paragraph.ChildObjects) { if (docObject.DocumentObjectType == DocumentObjectType.Picture) { DocPicture picture = docObject as DocPicture; String imageName = String.Format(@"images\Image-{0}.png", index); picture.Image.Save(imageName, System.Drawing.Imaging.ImageFormat.Png); index++; } } } } } } }
总结:
这里我使用的是E-iceblue公司的免费 word 组件,它除了可以从文档中提取图片,还可以提取文本,这里我只写了提取图片的,提取文本的也差不多,如有需要可以留言。
相关推荐
-
比较全的一个C#操作word文档示例
最近两天研究了一下如何使用VS2008(C#语言)输出Word文档.以下是几点总结: 1.非常简单. 2.开发及运行环境要求.操作系统为:WindowsXP(安装.net framework2.0)/Vista/Win7:在操作系统必须安装Word2003完全安装版.这里必须要强调是Word2003完全安装版,因为软件开发及运行都需要一个com组件:Microsoft word 11.0 Object Library.如果不是Word2003完全安装版,可以下载这个com组件,并手动的安装这个c
-
C#采用OpenXml给word里面插入图片
本文实例讲述了C#采用OpenXml给word里面插入图片的方法,分享给大家供大家参考.具体分析如下: 首先需要指出的是在MSDN官网有完整的OpenXML教程,虽然是全英文的不过还是很有帮助的. 注,原来摘抄代码里面没有模板,在copy过来发现插入word中的图片大小不一样,我们如何查找设置图片大小带代码的那一块,建议自己用在word里面插入一张图片,通过OpenXml Tools 反编译出C#代码,然后改变图片的大小,再次反编译. 使用byeond compare [http://www.s
-
C#获取Word文档中所有表格的实现代码分享
今天从数据库生成了一份数据字典,但是没有备注,所以需要程序把表格都读出来.用到了下面的代码,亲测可用~~ object oFileName = @"F:\数据库.docx"; object oReadOnly = false ; object oMissing = System.Reflection.Missing.Value; Microsoft.Office.Interop.Word._Application oWord; Microsoft.Office.Interop.Word
-
C#创建一个Word并打开的方法
本文实例讲述了C#创建一个Word并打开的方法.分享给大家供大家参考.具体实现方法如下: 复制代码 代码如下: private static string _createNewWord(string allTnC) { Microsoft.Office.Interop.Word.Document wordDocument = null; Microsoft.Office.Interop.Word.Application wordApplication = null; st
-
C# 向Word中设置/更改文本方向的方法(两种)
一般情况下在Word中输入的文字都是横向的,今天给大家分享两种方法来设置/更改一个section内的所有文本的方向及部分文本的方向,有兴趣的朋友可以试下. 首先,从https://visualstudiogallery.msdn.microsoft.com/d3a38f74-3490-42da-bdb0-37fa5acebc36下载免费版.NET Word类库并安装,然后创建一个C# 控制台应用程序,添加引用及命名空间并参考以下步骤. 步骤1:创建一个新的Document对象并加载Word文档.
-
C#实现通过模板自动创建Word文档的方法
本文实例讲述了C#实现通过模板自动创建Word文档的方法,是非常实用的技巧.分享给大家供大家参考.具体实现方法如下: 引言:前段时间有项目要用c#生成Word格式的计算报告,通过网络查找到很多内容,但是都很凌乱,于是自己决定将具体的步骤总结整理出来,以便于更好的交流和以后相似问题可以迅速的解决! 现通过具体的示例演示具体的步骤: 第一步,制作模板 1.新建一个文档,设置文档内容. 2.在相应位置插入书签:将鼠标定位到要插入书签的位置,点击"插入">"书签&quo
-
C#实现HTML转WORD及WORD转PDF的方法
本文实例讲述了C#实现HTML转WORD及WORD转PDF的方法.分享给大家供大家参考.具体如下: 功能:实现HTML转WORD,WORD转PDF 具体代码如下: using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.Text; using System.Windows.Forms; usi
-
C#采用OpenXml给Word文档添加表格
本文实例讲述了C#采用OpenXml给Word文档添加表格的方法,是非常实用的操作技巧.分享给大家供大家参考.具体分析如下: 这里将展示如何使用Openxml向Word添加表格. 代码中表头和数据我们用的同一个TableRow来添加,其实可以通过TableHeader来,其实都一样.后面我们还会进一步给出如何设置单元格样式.表头那一行可以自己通过设置样式来控制 示例代码如下: using System; using System.Collections.Generic; using System
-
使用C#实现在word中插入页眉页脚的方法
针对Word的操作是很多程序都具备的功能,本文即以实例展示使用C#实现在word中插入页眉页脚的方法,供大家参考借鉴,具体方法如下: 一.插入页脚的方法: public void InsertFooter(string footer) { if (ActiveWindow.ActivePane.View.Type == WdViewType.wdNormalView || ActiveWindow.ActivePane.View.Type == WdViewType.wdOutlineView)
-
如何使用C#从word文档中提取图片
图片和文字是word文档中两种最常见的对象,在微软word中,如果我们想要提取出一个文档内的图片,只需要右击图片选择另存为然后命名保存就可以了,今天这篇文章主要是实现如何使用C#从word文档中提取图片. 这里我准备了一个含有文字和图片的word文档: 详细步骤与代码: 步骤1 : 添加引用. 新建一个Visual C#控制台项目,添加引用并使用如下命名空间: using System; using Spire.Doc; using Spire.Doc.Documents; using Spir
-
asp.net下用Aspose.Words for .NET动态生成word文档中的图片或水印的方法
1.概述 在项目中生成word文档,这个功能很普遍的,一般生成都是纯文字或是列表的比较多,便于客户打印,而要把图片也生成到word文档中的需求有些客户也是需要的,例如产品图片.这次我们介绍的是如何利用Aspose.Words for .NET在Word中动态的生成图片或水印.Aspose.Words for .NET,这个我就不多介绍了,不清楚的朋友可以看看上一篇文章.需求总是变化得快,最近项目中又多了一个这样需求:系统中生成报价单后,要有一个签名,这个签名是根据不同用户来生成的图片.好了,下面
-
asp.net下用Aspose.Words for .NET动态生成word文档中的数据表格的方法
1.概述 最近项目中有一个这样的需求:导出word 文档,要求这个文档的格式不是固定的,用户可以随便的调整,导出内容中的数据表格列是动态的,例如要求导出姓名和性别,你就要导出这两列的数据,而且这个文档不是导出来之后再调整而是导出来后已经是调整过了的.看到这里,您也许马上想到用模板导出!而且.NET中自带有这个组件:Microsoft.Office.Interop.Word,暂且可以满足需求吧.但这个组件也是有局限性的,例如客户端必须装 office组件,而且编码复杂度高.最麻烦的需求是后面那个-
-
C#向Word文档中添加内容控件的方法示例
前言 大家应该都知道在MS Word中,我们可以通过内容控件来向word文档中插入预先定义好的模块,指定模块的内容格式(如图片.日期.列表或格式化的文本等),从而创建一个结构化的word文档. 下面就来看看如何使用C#给word文档添加组合框.文本.图片.日期选取器及下拉列表等内容控件(这里我借助了一个word组件Spire.Doc). 添加组合框内容控件 组合框用于显示用户可以选择的项目列表.和下拉列表不同的是组合框允许用户编辑或添加项. 核心代码如下: //给段落添加一个内容控件并指定它的S
-
Java 在 Word 文档中使用新文本替换指定文本的方法
创作一份文案,经常会高频率地使用某些词汇,如地名.人名.人物职位等,若表述有误,就需要整体撤换.文本将介绍如何使用Spire.Doc for Java,在Java程序中对Word文档中的指定文本进行替换. 工具/原料 Free Spire.Doc for Java(免费版) IntelliJ IDEA Jar文件获取及导入 方法1:先从官网下载jar包. 导入步骤: 下载后,解压文件,并将lib文件夹下的Spire.Doc.jar文件导入java程序.参考如下导入效果: 方法2:可通过maven
-
Java 在Word文档中添加艺术字的示例
与普通文字相比,艺术字更加美观有趣也更具有辨识度,常见于一些设计精美的杂志或宣传海报中.我们在日常工作中编辑Word文档时,也可以通过添加艺术字体来凸显文章的重点,美化页面排版.这篇文章将介绍如何使用Free Spire.Doc for Java在word文档中添加艺术字并设置样式和效果. Jar包导入 方法一:下载Free Spire.Doc for Java包并解压缩,然后将lib文件夹下的Spire.Doc.jar包作为依赖项导入到Java应用程序中. 方法二:通过Maven仓库安装JAR
-
Java 如何将表格数据导入word文档中
Java 表格数据导入word文档中 个人觉得这个功能实在搞笑,没什么意义,没办法提了需求就要实现,(太好说话了把我) 我的实现是再word中生成一个与 excel行,列 一样的一个表格,然后把从excel拿到的数据(exList参数)依次放到word表格中 public static void createFile(HttpServletResponse response, String fileName, List<List<String>> exList) { try { s
-
C#/VB.NET实现在Word文档中添加页眉和页脚
目录 程序环境 在 Word 文档中添加页眉和页脚 完整代码 效果图 页眉位于文档中每个页面的顶部区域,常用于显示文档的附加信息,可以插入时间.图形.公司微标.文档标题.文件名或作者姓名等:页脚位于文档中每个页面的底部的区域,常用于显示文档的附加信息,可以在页脚中插入文本或图形.今天这篇文章就将为大家展示如何以编程的方式在在 Word 文档中添加页眉和页脚.下面是我整理的思路及方法,并附上C#/VB.NET供大家参考. 程序环境 本次测试时,在程序中引入Free Spire.Doc for .N
-
C#/VB.NET中从 PDF 文档中提取所有表格
目录 前言 安装 从PDF文档中提取表格 前言 有时,我们可能需要从 PDF 文档中提取表格数据,例如,当PDF发票的表格中存储了一些有用的信息,需要提取数据以进行进一步分析时.在这篇文章中,我将介绍如何使用Spire.PDF for .NET 从 PDF 文档中提取所有表格数据. 安装 首先,我们需要将 Spire.PDF for .NET 包中包含的 DLL 文件添加为 .NET 项目中的引用.可以从此链接下载 DLL 文件,也可以通过 NuGet 安装 DLL 文件. PM> Instal
-
使用c#在word文档中创建表格的方法详解
复制代码 代码如下: public string CreateWordFile() { string message = ""; try { Object Nothing = System.Reflection.Missing.Value; string name = "xiehuan.doc";
随机推荐
- JQuery 的跨域方法推荐_可跨任何网站
- 详解Spring Boot配置文件之多环境配置
- 详解java中的互斥锁信号量和多线程等待机制
- iOS开发中控制屏幕旋转的编写方法小结
- 移动端触摸滑动插件swiper使用方法详解
- python和C语言混合编程实例
- Go语言多值替换的HTML模板实例分析
- Golang学习笔记(二):类型、变量、常量
- 理解javascript中DOM事件
- 使用jQuery判断浏览器滚动条位置的方法
- 用js来解决ajax读取页面乱码
- jquery里的each使用方法详解
- 深入解读防火墙-深入防火墙记录(2)
- Javascript 按位与赋值运算符 (&=)使用介绍
- 纯JavaScript实现的分页插件实例
- Android TextView控件文字添加下划线的实现方法
- 深入Sqlite多线程入库的问题
- iOS开发中文件的上传和下载功能的基本实现
- AsyncTask的三个属性值和四个步骤
- C#程序提示“正由另一进程使用,因此该进程无法访问该文件”的解决办法