强迫症患者修理 PDF

三太爷好学习,有时候就从网上找一些资料来看。纵览各种文档格式,通常还是 PDF 的文档质量会高一些,因此也是我阅读的首选。可是总有那么些讨人厌的家伙,喜欢在原始的文档上做手脚,添加各种标记,有的是口号,有的是标识,乱七八糟。这就很不对我的胃口了,所以我一般会在阅读之前处理一下,把那些干扰视线的东西删除掉。所使用的工具,则是小巧强悍的 Foxit PDF Editor,主文件是 2.2.1.1102 的版本。

这次的这篇文档也不例外,只是要编辑的时候才发现是一篇加了密的文档,之前趁手的工具是 Advanced PDF Password Recovery Pro,不在手边,于是到网上下载了个 PDF Password Remover 下来,结果也可以。这个 PDF 是一本书,二百四五十页的样子,每一页上有两个“创可贴”要删除,以前遇到这样的东西,三太爷是纯体力搞掉它们的,这次动了心思,想用程序自动化一下,于是打开刚刚安装没几天的 Visual Studio 2013 Express 开始写程序,昨晚写到关键的地方,要去听 Martin Fowler 的讲座,所以今天才续写完毕。测试的结果很令人满意,把该删除的全删除了,当然,中间一次有 BUG 的时候,还把不该删除的也删除了一些。

保存后的文档,有点残疾。用 Foxit PDF Editor 自己打开毫无问题,但是用 Adobe Reader 打开就会报告 109 错误,在 OS X 下,预览程序也打不开。使用 ABBYY FineReader 打开了一次(这个程序牛叉的地方在于,它会把打开文档过程中遇到的错误记录显示出来),找到了错误所在的页面。可是不知道该如何修正错误,于是又到网上搜索,看有没有专门的工具,发现了 DataNumen PDF Repair 这个工具(http://www.datanumen.com/pdf-repair/)。用该工具检查文档,报告说此文档可修复,但是由于这是演示版,它屏蔽了保存的功能,但是可以预览。以三太爷的阅历,知道这种情况下,完整的文档通常应该在磁盘上的某处(例如系统的临时文件夹)。可惜多虑了一步,没有直接去临时文件目录找,而是用窗口探测工具查看该程序的界面结构,目的是试图把保存按钮从禁用状态修改为可用状态,哪知一看之下,发现其预览功能是使用了 Adobe Reader 的 ActiveX 控件,而该控件的窗口标题内则包含了所打开文档的完整路径。搞笑的就在于,所在路径恰恰就是系统的临时文件目录。

三太爷毫不犹豫地打开临时文件夹,把那个 PDF 复制了出来。打开一下,完美无暇。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注