Pdf文件目前是一种非常普遍的格式。有时你需要将pdf文件转换成图像或文件,合并内容,甚至使用软件来改变内容。然而,目前,一些PDF软件必须付费才能使用,或者功能相对简单。
然而,最近,一个完全免费的开源多功能PDF工具包已经公布,即 “pdfpatcher”。据作者介绍,该软件是在2009年开发的,今年已经12岁了。因此,在没有盈利的情况下,很难生存和发展这么长时间。
此外,作者还说,开源的作用是让人们了解PDF文档处理的技术。同时,用户还应该注意源代码中使用的 “良心许可 “协议。如果源代码被用于开发新的软件并产生收入,则至少应将收入的千分之一捐赠给社会弱势群体,且不得少于千分之一。
PDF补丁丁介绍
虽然PDF Patch Thing的界面看起来有点 “历史”,但其功能一点也不弱。这里有一些重要的功能。
识别图像文本:
目前,许多人不得不为OCR软件付费。在这里,它支持识别原始PDF文件中的图像和文本,并将它们写入PDF文件。在功能上,它还支持文字排版方向、校正、删除汉字之间的空格等。
识别书签:
它支持编辑PDF文档的标签,根据你的文档自动生成合适的书签,导出和导入书签,改变页码,合并标签,指定标签格式等。
提取页面:
要提取PDF文档的页面,你可以选择要保留的内容,包括书签、属性、约束等。
批量修改文档:
你可以在批处理中移除PDF打印和复制限制,改变文档属性、页码、页面链接、页面大小,优化体积,删除自动打开的网页等。
提取图片:
对于PDF文档中的图像的批量导出,你可以设置提取的页码范围,将图像合并为PNG,将图像导出为注释,设置文件重命名和其他设置。
功能特色
改变PDF信息。
改变文档属性、页码、页面链接和页面大小;删除自动打开网页等操作,取消复制和打印的限制;设置阅读器的初始模式。
贴心的PDF书签编辑器。
它有一个阅读界面(从右到左的阅读模式,方便阅读垂直文档),可以批量改变PDF书签属性(颜色、样式、目标页码、比例等),在书签中进行搜索和替换(支持正则表达式和XPath匹配,快速选择文章、章节的书签),并自动快速生成文档书签。
生成 PDF 书签。
无需手动输入,它可以自动识别文本标题或目录,并为PDF文档生成书签。
创建PDF文件。
合并现有的PDF文件或图像以生成新的PDF文件。合并后的PDF文件具有原文件的书签,也可以挂上新的书签(或根据文件名生成)。新书签的文字和风格可以自定义。
分割合并。
拆分或合并PDF文件,并保留原文件的书签或挂一个新书签。
出口图像。
从PDF文件中高速无损地导出图像。
摘录页。
提取或删除PDF文档中的指定页面,并调整PDF文档的页面顺序。
重新命名。
根据PDF文档的元数据重命名PDF文件的名称。
字符识别。
调用Microsoft Office的图像识别引擎来分析PDF文档图像中的文字;将图像PDF的目录页转换成PDF书签。识别结果可以被写入PDF文件。
替换字体。
替换文档中使用的字体库;将字库整合到PDF文档中,以消除复制文本时的随机代码,这样就可以在没有字库的设备(如Kindle等电子书阅读器)上阅读。
分析文件结构。
PDF文档的结构以树状视图显示。你可以编辑和改变PDF文档的节点或将PDF文档导出为XML文件,供PDF爱好者分析和调试。
总结
就个人工作而言,开发这种规模的软件并不那么容易。无论你是偶尔还是经常使用PDF编辑软件,这个PDF补丁都值得收集和准备。另外,由于该项目是开源的,我相信将来会有更多基于PDF补丁的版本被开发出来。
项目地址
https://github.com/wmjordan/PDFPatcher