利用C#/VB.NET实现将PDF转为Word

目录
  • 将 PDF 转换为固定布局的 Doc/Docx 文档
    • 完整代码
  • 将 PDF 转换为流动形态的 Doc/Docx 文档
    • 完整代码
    • 效果图

众所周知,PDF 文档支持特长文件,集成度和安全可靠性都较高,可有效防止他人对 PDF 内容进行更改,所以在工作中深受大家喜爱。但是在工作中,我们不可避免的会对 PDF 文档进行修改或再编辑,这时我们可以将 PDF 转换为 Word 文档格式进行修改。本文将分为两部分介绍如何以编程的方式将 PDF 转换为 Word。

  • 将 PDF 转换为固定布局的 Doc/Docx 文档
  • 将 PDF 转换为流动形态的 Doc/Docx 文档

固定布局模式转换速度快,有利于最大程度保持 PDF 文件的原貌。但是,生成的文档的可编辑性将受到限制,因为 PDF 中的每一行文本将在生成的 Word 文档中显示在单独的框架中。

流动形态是一种完整的识别模式。转换后的内容不会以框架形式呈现,并且生成的文档的结构是可流动的。生成的 Word 文档很容易重新编辑,但看起来可能与原始 PDF 文件不同。

将 PDF 转换为固定布局的 Doc/Docx 文档

  • 创建一个 PdfDocument 对象。
  • 使用 PdfDocument.LoadFromFile() 方法加载示例 PDF 文件。
  • 使用 PdfDocument.SaveToFile() 方法将 PDF 转换为 .doc/.docx 格式文件并保存。

完整代码

C#

using Spire.Pdf;

namespace ConvertPdfToDoc
{
    class Program
    {
        static void Main(string[] args)
        {
            //创建一个 PdfDocument 对象
            PdfDocument doc = new PdfDocument();

            //加载示例 PDF 文件
            doc.LoadFromFile("示例.pdf");

            //将PDF转换为Doc格式文件并保存
            doc.SaveToFile("ToDoc.doc", FileFormat.DOC);

            //将PDF转换为Docx格式文件并保存
            doc.SaveToFile("ToDocx.docx", FileFormat.DOCX);

        }
    }
}

VB.NET

Imports Spire.Pdf

Namespace ConvertPdfToDoc
    Friend Class Program
        Private Shared Sub Main(ByVal args As String())
            '创建一个 PdfDocument 对象
            Dim doc As PdfDocument = New PdfDocument()

            '加载示例 PDF 文件
            doc.LoadFromFile("示例.pdf")

            '将PDF转换为Doc格式文件并保存
            doc.SaveToFile("ToDoc.doc", FileFormat.DOC)

            '将PDF转换为Docx格式文件并保存
            doc.SaveToFile("ToDocx.docx", FileFormat.DOCX)

        End Sub
    End Class
End Namespace

将 PDF 转换为流动形态的 Doc/Docx 文档

创建一个 PdfDocument 对象。

使用 PdfDocument.LoadFromFile() 方法加载示例 PDF 文件。

使用 PdfConvertOptions.SetPdfToDocOptions(bool usePsMode,bool useFlowRecognitionMode) 方法将转换引擎设置为 PS 模式并将识别模式设置为流。

使用 PdfDocument.SaveToFile() 方法将文档转换为.doc/.docx 格式的文件。

完整代码

C#

using Spire.Pdf;

namespace ConvertPdfToDocxUsingPsMode
{
    class Program
    {
        static void Main(string[] args)
        {
            //创建一个 PdfDocument 对象
            PdfDocument doc = new PdfDocument();

            //加载示例 PDF 文件
            doc.LoadFromFile("示例.pdf");

            // PDF转Word使用PS模式,识别模式设置为流
            doc.ConvertOptions.SetPdfToDocOptions(true, true);

      //将PDF转换为Doc格式文件并保存
            doc.SaveToFile("ToDoc1.doc", FileFormat.DOC);

            //将PDF转换为Docx格式文件并保存
            doc.SaveToFile("ToDocx1.docx", FileFormat.DOCX);
        }
    }
}

VB.NET

Imports Spire.Pdf

Namespace ConvertPdfToDocxUsingPsMode
    Friend Class Program
        Private Shared Sub Main(ByVal args As String())
            '创建一个 PdfDocument 对象
            Dim doc As PdfDocument = New PdfDocument()

            '加载示例 PDF 文件
            doc.LoadFromFile("示例.pdf")

            ' PDF转Word使用PS模式,识别模式设置为流
            doc.ConvertOptions.SetPdfToDocOptions(True, True)

            '将PDF转换为Doc格式文件并保存
            doc.SaveToFile("ToDoc1.doc", FileFormat.DOC)

            '将PDF转换为Docx格式文件并保存
            doc.SaveToFile("ToDocx1.docx", FileFormat.DOCX)
        End Sub
    End Class
End Namespace

效果图

到此这篇关于利用C#/VB.NET实现将PDF转为Word的文章就介绍到这了,更多相关C# PDF转Word内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • C#将Word转换成PDF方法汇总(基于Office和WPS)

    有时候,我们需要在线上预览word文档,当然我们可以用NPOI抽出Word中的文字和表格,然后显示到网页上面,但是这样会丢失掉Word中原有的格式和图片.一个比较好的办法就是将word转换成pdf,然后让客户预览,下面来看一下基于Office和WPS的两种解决方案. 一.基于Office的解决方案 正如标题所说,基于Office就是要求服务器上面要安装的有Office.我们通过C#代码来调用COM接口,实现将Word转换成PDF.下面来看一下具体实现,首先引用Microsoft.Office.I

  • C# 利用Aspose.Words.dll将 Word 转成PDF

    只要把aspose.words.dll 在bin中添加引用即可. 复制代码 代码如下: using System;using System.Collections.Generic;using System.ComponentModel;using System.Data;using System.Drawing;using System.Text;using System.Windows.Forms;using Aspose.Words;using Aspose.Words.Saving;usi

  • C#实现HTML转WORD及WORD转PDF的方法

    本文实例讲述了C#实现HTML转WORD及WORD转PDF的方法.分享给大家供大家参考.具体如下: 功能:实现HTML转WORD,WORD转PDF 具体代码如下: using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.Text; using System.Windows.Forms; usi

  • C#实现Word转为PDF的方法

    这里主要提供一种将word文档转成PDF文档的实现: 具体实现看c#代码:要引入Microsoft.Office.Interop.Word;版本12.0.0.0 using System; using System.Collections.Generic; using System.IO; using System.Linq; using System.Text; using System.Runtime.InteropServices; using Microsoft.Office.Inter

  • c#开发word批量转pdf源码分享

    微软Office Word本身已经提供了另存为PDF文档功能,对于少量文档,手工使用该方式进行Word转换为PDF尚可,一旦需要处理大量的文档,可能就显得有些捉襟见肘了.不过对于已经安装有Office环境,借助一些简单的代码即可实现批量Word转PDF了. 源码: 复制代码 代码如下: using System;using System.Collections.Generic;using System.ComponentModel;using System.Data;using System.D

  • 利用C#/VB.NET实现将PDF转为Word

    目录 将 PDF 转换为固定布局的 Doc/Docx 文档 完整代码 将 PDF 转换为流动形态的 Doc/Docx 文档 完整代码 效果图 众所周知,PDF 文档支持特长文件,集成度和安全可靠性都较高,可有效防止他人对 PDF 内容进行更改,所以在工作中深受大家喜爱.但是在工作中,我们不可避免的会对 PDF 文档进行修改或再编辑,这时我们可以将 PDF 转换为 Word 文档格式进行修改.本文将分为两部分介绍如何以编程的方式将 PDF 转换为 Word. 将 PDF 转换为固定布局的 Doc/

  • C#/VB.NET 实现彩色PDF转为灰度PDF

    目录 配置程序环境 转彩色PDF为灰度 转换结果 补充 本文以C#代码为例介绍如何实现将彩色PDF文件转为灰度(黑白)的PDF文件,即 将PDF文档里面的彩色图片或者文字等通过调用PdfGrayConverter.ToGrayPdf()方法转为文档页面为灰色调.无彩色效果的文档.下面的程序运行环境及代码示例. 配置程序环境 Visual Studio 2017 .Net Framework 4.6.1 Spire.PDF for .NET 关于如何引入dll文件: 1.通过NuGet安装dll(

  • 详解用Python把PDF转为Word方法总结

    先讲一下为啥要写这个文章,网上其实很多这种PDF转化的代码和软件.我一直想用Python做,但是网上搜到的代码很多都不能用,很多是2.7版本的代码,再就是PDF需要用到的库在导入的时候,很多的报错,解决起来特别费劲,而且自从2021年初以来,似乎网上很少有关PDF转化的代码出现了.我在研究了很多代码和pdfminer的用法后,总结了几个方法,目前这几种方法可以解决大多数格式的转化,后面我也专门放了提取PDF表格的代码,文末有高效的免费在线工具推荐. 下面这个是我最最推荐的方法 ,简单高效 ,只要

  • C#/VB.NET实现将Html转为Word的示例详解

    目录 前言 实现代码 C# vb.net 前言 本文分享以C#程序代码为例,实现将Html文件转换Word文档的方法(附VB.NET代码).在实际转换场景中可参考本文的方法,转换前,请按照如下方法引用Word API的dll文件到Visual Studio.安装时,可通过以下2种方法: 1.通过NuGet安装dll(2种方法) 1.1 可以在Visual Studio中打开“解决方案资源管理器”,鼠标右键点击“引用”,“管理NuGet包”,然后搜索“Free Spire.Doc”,点击“安装”.

  • Java实现PDF转为Word文档的示例代码

    目录 代码编译环境 将 PDF 转换为固定布局的 Doc/Docx 文档 完整代码 将 PDF 转换为流动形态的 Doc/Docx 文档 完整代码 效果图 众所周知,PDF文档除了具有较强稳定性和兼容性外, 还具有较强的安全性,在工作中可以有效避免别人无意中对文档内容进行修改.但与此同时,也妨碍了对文档的正常的修改.这时我们可以将PDF转为Word文档进行修改或再编辑.使用软件将 PDF 文档转换为 Word 文档十分简单,然而要在转换时保持布局甚至字体格式却并不容易.本文将分为以下两部分介绍如

  • C#/VB.NET实现将XML转为PDF

    目录 引入dll 方法1 方法2 将XML转为PDF C# VB.NET 补充 可扩展标记语言(XML)文件是一种标准的文本文件,它使用特定的标记来描述文档的结构以及其他特性.通过将XML转换为PDF,能够便于文件传输及共享.本文,将介绍通过C#及VB.NET代码来实现该格式转换的方法. 引入dll 方法1 在程序中引入Spire.Doc.dll文件:将 Free Spire.Doc for .NET 下载到本地,解压,找到BIN文件夹下的Spire.Doc.dll.然后在Visual Stud

  • 如何利用Python将html转为pdf、word文件

    目录 前言 转 pdf 安装 pdfkit 库 安装 wkhtmltopdf 文件 url 生成 pdf 本地 html 文件生成 pdf 转 word 安装 pypandoc 库 安装 pandoc 软件 使用 补充:用python把pdf文件转换为word文件 总结 前言 在日常中有时需将 html 文件转换为 pdf.word 文件.网上免费的大多数不支持多个文件转换的情况,而且在转换几个后就开始收费了. 转 pdf 转 pdf 中使用 pdfkit 库,它可以让 web 网页直接转为 p

  • JAVA基于PDF box将PDF转为图片的实现方法

    在一项目中用到,本身我是.NET的,团队中有用到JAVA,故此我处理这个功能,记录以下备用. 1.引用:fontbox-2.0.16.jar.pdfbox-app-2.0.16.jar 版本一定要正确,否则代码会有问题. main函数: package kevin.cn; import java.awt.image.BufferedImage; import java.io.ByteArrayOutputStream; import java.io.File; import java.io.Fi

  • C#实现将PDF转为线性化PDF

    目录 程序环境 方法步骤 步骤1. 安装PDF插件. 步骤2. 编辑如下代码实现转换. 线性化PDF文件是PDF文件的一种特殊格式,可以通过Internet更快地进行查看.线性化的PDF,在页面数量很多的情况下,更能突出表现出快速浏览的优势.下面是通过后端.NET程序实现将PDF文件转为线性化PDF的方法. 程序环境 Visual Studio 2017 .NET Framework 4.6.1 Spire.PDF for .NET 7.12.1 方法步骤 步骤1. 安装PDF插件. 可通过以下

  • C#实现将PDF转为Excel的方法详解

    目录 dll引用方法 方法1 方法2 PDF转Excel C# VB.NET 通常,PDF格式的文档能支持的编辑功能不如office文档多,针对PDF文档里面有表格数据的,如果想要编辑表格里面的数据,可以将该PDF文档转为Excel格式,然后编辑.本文,将以C#代码为例,介绍如何实现由PDF格式到Excel文档格式的转换.下面是具体步骤. dll引用方法 方法1 在程序中引入Spire.Pdf.dll文件:将 Spire.PDF for .NET 下载到本地,解压,安装.安装完成后,找到安装路径

随机推荐