PHP sdk文档处理常用代码示例解析

主要是:ppt文件转为pdf文件,pdf文件转图片(png)。

描述一下需求:上传PPT或者PDF文件到七牛,最终转换为图片。文件上传部分的功能已经讲过了,这里说一下转换处理的部分。

文档类型

因为七牛整个的文件存储系统中文件类型并不靠后缀来区分,而是有它自己的 文件类型(mineType),所以在堆bucket中的资源进行处理的时候,首先要判断minetype。

多次的测试结果表明,pdf文件上传后的minetype一为application/pdf,而ppt上传后的类型就比较多了,通过jssdk上传,以及直接在七牛上传,上传后缀为ppt、pptx的结果都有可能不一样。最终总结出如下的几种类型:

application/vnd.openxmlformats-officedocument.presentationml.presentation
application/zip
application/vnd.ms-powerpoint
application/ppt
application/x-ole-storage

这里的文档类型判断PHP-SDK已经提供了,是BucketManager这个类。

//使用方式
$bucketManager = new BucketManager($this->getAuth());//getAuth()方法见七牛php-sdk使用-文件上传
$mineTypeInfo = $bucketManager->stat(bucketName, 七牛资源名);
$mimeType = $mineTypeInfo[0]['mimeType'];

持久化处理

七牛的服务都是通过http请求附加不同的参数来实现的,比如我们处理剪裁一张图片,或者获取视频某一秒的截图,在我们的页面中可以直接使用src=http://qiniu.com.cn?xxx这种方式,就能得到我们想要结果,但有的时候我们需要把处理的结果保存到我们的bucket中,这个就是持久化处理了。

根据sdk封装一个持久化处理的方法,用到的sdk类为PersistentFop:

/**
 * 文件持久化处理
 * @param  $key 七牛资源名
 * @param  $pfop 对资源进行的数据处理操作的命令
 * @param  $bucket bucketName
 * @return persistentId
 */
 public function persistentOps($key,$bucket,$pfop,$notifyUrl='',$check=true)
 {
   header('Access-Control-Allow-Origin:*');

   $auth = $this->getAuth();
   $persistOps = new PersistentFop($auth,$bucket,$this->qiniu_image_pipeline,$notifyUrl);
   list($id,$error) = $persistOps->execute($key,$pfop);
   if($check){
     //可暂时忽略,用来检查资源持久化处理状态
     $result = $this->checkStatus($id,$persistOps);
   }else{
     $result = true;
   }
   return $result;
 }

PPT转PDF

使用到的持久化出来命令为:$pfop[] = 'yifangyun_preview/v2|saveas/'.$key;,这里使用的是七牛的第三方文档转换服务,因为七牛之前的odconv/pdf已经不再更新维护了,而且出现过转为pdf排版出现遮挡以及乱码等问题,所以改为使用亿方云的服务。

这里面saveas,即保存为一个新的资源,$key需要做一下说明,按照七牛的要求必须是:

$key = \Qiniu\base64_urlSafeEncode(bucketName.':'.$sourceName);

如果不按照规则进行encode,无法保存成功。base64_urlSafeEncode,sdk functions.php中已经存在。

有了原始的key,saveas的key,以及pfop持久化处理命令,就可以调用persistentOps方法了:

$result = $this->persistentOps($sourceName,$bucketName,$pfop);

pfop可以是一个数组,包含多个处理命令。

PDF转图片PNG

因为没有PPT转图片这条路,所以只能先转PDF。

用到的pfop命令:

odconv/png/page/页码/density/150/quality/80|saveas/'.$key;

参数包括页码,质量,像素密度等,还有更多的参数可以查阅文档。所以这里我们首先要获取PDF文档的总页数。使用到的接口命令是:

//odconv/png/info
$url = 'http://'.$this->qiniu_image_domain.'/'.$sourceName.'.pdf?odconv/png/info';
//url部分就是七牛资源可以访问的完整链接,?后面就是要用到的命令

使用curl去请求这个链接,会返回json数据,里面会包含page_num成员。

有了page_num,就可以构造pfop数组了。

public function pdf2PngPfop($page,$sourceName)
{
   $pfop = [];
   $pngName = $sourceName;//原图
   for($i=1;$i<=$page;$i++){
     $randName = $pngName.'_'.$i.'.png';//原图
     $key = \Qiniu\base64_urlSafeEncode($this->bucket_for_image.':'.$randName);
     $pfop[] = 'odconv/png/page/'.$i.'/density/150/quality/80|saveas/'.$key;
   }
   return $pfop;
 }

然后调用:

$res = $this->persistentOps($sourceName.'.pdf',$this->bucket_for_image,$pfop,'',false);

note:在处理比较大的文档,例如一个PPT有100多页,那PHP运行等待七牛的结果返回再进行数据的保存就可能会超时,一个解决方案,是指定回调url,persistentOps的倒数第二个参数就是回调url,当文档转换完成的时候,七牛会向这个地址发起一个请求,后续的图片链接保存操作我们交给回调来做。

tips: 如果对每个pfop命令都指定回调地址,对我们的(普通)业务服务器也会造成些许的请求压力,所以我的做法是给最后一页的PDF转图片命令添加回调url。

回调地址函数

public function actionQiniuCallback()
{
  $notifyBody = file_get_contents('php://input');
  $notifyBodyArray = json_decode($notifyBody,true);

  $topicId = Yii::$app->request->get('topicId');
  $totalPage = Yii::$app->request->get('totalPage');//pdf页数
  $key = $notifyBodyArray['inputKey'];//这个是pdf文件的key
  //业务代码
  ...
}

总结

php来做这个文档转换七牛七牛遇到的一个主要问题就是超时的问题,所以我们可以把转换的过程拆解,在数据库中保存处理状态,然后用定时任务来自动处理。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持我们。

(0)

相关推荐

  • PHPExcel导出2003和2007的excel文档功能示例

    本文实例讲述了PHPExcel导出2003和2007的excel文档功能.分享给大家供大家参考,具体如下: require_once 'common/excel/PHPExcel.php'; require_once 'common/excel/phpExcel/Writer/Excel2007.php'; require_once 'common/excel/phpExcel/Writer/Excel5.php'; include_once 'common/excel/phpExcel/IOF

  • 使用PHPWord生成word文档的方法详解

    本文实例讲述了使用PHPWord生成word文档的方法.分享给大家供大家参考,具体如下: 有时我们需要把网页内容保存为Word文档格式,以供其他人员查看和编辑.PHPWord是一个用纯PHP编写的库,使用PHPWord可以轻松处理word文档内容,生成你想要的word文档. 下载源码 安装 我们使用Composer 来安装PHPWord. composer require phpoffice/phpword 如何使用 自动加载 安装好phpword后,新建一个php文档,引入autoload.p

  • PHP生成word文档的三种实现方式

    最近工作遇到关于生成word的问题 现在总结一下生成word的三种方法. btw:好像只要是标题带PHP的貌似点击量都不是很高(哥哥我标题还是带上PHP了),不知道为什么,估计博客园上net技术大牛比较多吧,如果把java,.net,php比作程序员的女友,那么java是Oracle门下的大家闺秀,.net微软旗下的名门望族,PHP则是草根门下的山村野姑,这让我等PHP草民闷骚男情何以堪情何以堪..牢骚发完了,正式写吧 PHP生成word原理 利用windows下面的 com组件 利用PHP将内

  • PHP实现动态创建XML文档的方法

    本文实例讲述了PHP实现动态创建XML文档的方法.分享给大家供大家参考,具体如下: 一. 代码 conn.php <?php $id=mysql_connect("localhost","root","root") or die('数据库连接失败:' . mysql_error()); if(mysql_select_db("db_database26",$id)) echo ""; else ech

  • PHP实现仿百度文库,豆丁在线文档效果(word,excel,ppt转flash)

    本文实例讲述了PHP实现仿百度文库,豆丁在线文档效果.分享给大家供大家参考,具体如下: 由于项目要实现类似百度文库的功能,又是我一个人做的项目,所以就想到找免费的现成的来使用.在网上找到的都是一样的.如下: Flash Paper支持Office文档(.doc,.xls,.ppt)直接转换为PDF或SWF,速度很快,效果较好.可惜,Flash Paper V2.2后没有再更新了.安装Flash Paper后,可以直接使用命令调用FlashPrinter.exe,实现批量转换. 例如:C:\Fla

  • PHP库 查询Mongodb中的文档ID的方法

    在IBM我的一份新工作是一名开发的后勤人员.那意味着我的大部分时间是在和数据库打交道.在我的工作流程中,我花了一些时间在MongoDB上面--这是一个文档数据库.但是在通过ID来检索记录这个操作上面我碰到了一些问题.下面的代码是最终版本,以后碰到类似的问题我可以直接引用它.如果大家也需要,希望下面对大家有所帮助. MongoDB 和 IDs 当我向一个集合中插入数据的时候,我并没有设置_id字段:如果这个字段是空的话,那么MongoDB将要自动生成一个ID来使用,这对我来说是非常不错的.然而,当

  • PHP读取word文档的方法分析【基于COM组件】

    本文实例讲述了PHP读取word文档的方法.分享给大家供大家参考,具体如下: php开发 过程中可能会word文档的读取问题,这里可以利用com组件来完成此项操作 一.先开启php.ini的COM,操作如下 1. extension=php_com_dotnet.dll 2. com.allow_dcom = true 二.开启之后就可以试下如下操作 1.建立一个指向新COM组件的索引 $word = new COM("word.application") or die("C

  • php删除txt文件指定行及按行读取txt文档数据的方法

    本文实例讲述了php删除txt文件指定行及按行读取txt文档数据的方法.分享给大家供大家参考,具体如下: 向txt文件循环写入值: $keys = range(1,999); $file = fopen('key_11010000.txt',"w"); foreach($keys as $key){ fwrite($file,"$key\r\n"); } fclose($file); $f1 = fopen('key_11010000.txt','r'); whil

  • PHP sdk文档处理常用代码示例解析

    主要是:ppt文件转为pdf文件,pdf文件转图片(png). 描述一下需求:上传PPT或者PDF文件到七牛,最终转换为图片.文件上传部分的功能已经讲过了,这里说一下转换处理的部分. 文档类型 因为七牛整个的文件存储系统中文件类型并不靠后缀来区分,而是有它自己的 文件类型(mineType),所以在堆bucket中的资源进行处理的时候,首先要判断minetype. 多次的测试结果表明,pdf文件上传后的minetype一为application/pdf,而ppt上传后的类型就比较多了,通过jss

  • SpringBoot整合screw实现数据库文档自动生成的示例代码

    有时候数据库文档需要整理,可是只能手动的复制粘贴,心中一万只草泥马奔腾而过... screw 简洁好用的数据库表结构文档生成工具. 1. 创建项目 1.1 pom.xml <dependency> <groupId>mysql</groupId> <artifactId>mysql-connector-java</artifactId> <scope>runtime</scope> </dependency>

  • C# 实现TXT文档转Table的示例代码

    代码: public DataTable TXTToDataTable(string fileName, string columnName) { DataTable dt = new DataTable(); FileStream fs = new FileStream(fileName, System.IO.FileMode.Open, System.IO.FileAccess.Read); StreamReader sr = new StreamReader(fs, System.Text

  • 详解Swagger接口文档和常用注解的使用

    目录 一.Spring整合Swagger 二.swagger常用注解说明 1.@Api的使用说明 2.@ApiOperation的使用说明 3.@ApiParam的使用说明 4.@ApiModel的使用说明 5.@ApiModelProperty的使用说明 6.@ApiIgnore的使用说明 7.@ApiImplicitParam的使用说明 8.@ApiImplicitParams的使用说明 9.@ApiResponses与@ApiResponse使用说明 10.@RequestMapping注

  • 三种Java打印PDF文档的实例代码

    以下内容归纳了通过Java程序打印PDF文档时的3种情形.即: 1 静默打印 2 显示打印对话框打印 3 打印PDF时自定义纸张大小 使用工具:Spire.PDF for Java Jar文件获取及导入: 方法1:下载jar包.下载后,解压文件,并将lib文件夹下的Spire.Pdf.jar导入java程序. 方法2:可通过maven库导入.参考导入方法. Java代码示例 [示例1]静默打印 即通过使用默认打印机直接打印PDF文档.打印时,我们可以设置打印份数,设置纸张打印页边距等. impo

  • Python实现Word文档转换Markdown的示例

    随着SaaS服务的流行,越来越多的人选择在各个平台上编写文档,制作表格并进行分享. 同时,随着Markdown语法的破圈,很多平台开始集成支持这种简洁的书写标记语言,这样可以保证平台上用户文档样式的统一性. 但是在一些场景下,我们还是会在本地的Office软件上写有很多文档,或者历史遗留了很多本地文档. 如果我们需要将其上传到各大平台,直接复制粘贴,大概率是会造成文档内容结构和样式的丢失.于此我们需要将其转换为 Markdown 语法. 很多桌面软件(比如Typora)都提供了导入 Word 文

  • MongoDB快速入门笔记(四)之MongoDB查询文档操作实例代码

    MongoDB简介 MongoDB 是一个基于分布式文件存储的数据库.由 C++ 语言编写.旨在为 WEB 应用提供可扩展的高性能数据存储解决方案. MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的. 下面给大家介绍MongoDB查询文档操作的实例 先把student删除,再重新插入数据 > db.student.drop() true > db.student.insert([{ "_id" : 1, "

  • JavaScript打开word文档的实现代码(c#)

    在C#中打开word文档其实不算太难,方法也比较多. 一.C#中打开word文档方法 复制代码 代码如下: //在项目引用里添加上对Microsoft Word 11.0 object library的引用 private void button1_Click(object sender, System.EventArgs e) { //调用打开文件对话框获取要打开的文件WORD文件,RTF文件,文本文件路径名称 OpenFileDialog opd = new OpenFileDialog()

  • 用python将word文档合并实例代码

    目录 背景: 设计思路: 脚本环境说明: 完整代码: 功能执行效果图: 总结: 背景:         由于工作需要,现在有这么一个需求,要合并大量的word文档,而且要在不同的目录下找到同一个人的word文档,进行合并,最终输出一个合并后的word文档.一般来说几个或者十几个量不多的话,就手工合并一下好了,但现在这个量是真的大.目录有十多个,每个目录又有50多个不同人的word文档,而且同一个人在不同目录下又不一定都有word文档,因此,整个合并工作就出现了人工操作的困难: 工作量多:容易疏漏

  • python模块和函数帮助文档快速查看方法示例

    目录 引言 通用帮助函数help() 模块帮助查询 查看.py结尾的普通模块 查看内建模块 查询函数信息 查看模块下所有函数 查看模块下特定函数信息 查看函数信息的另一种方法 引言 python的一个优势是有着大量自带和在线的模块(module)资源,可以提供丰富的功能,在使用这些模块的时候,如果每次都去网站找在线文档会过于耗费时间,结果也不一定准确.因此这里介绍下python自带的查看帮助功能,可以在编程时不中断地迅速找到所需模块和函数的使用方法 通用帮助函数help() 在python命令行

随机推荐