1、 对于是图片做成的PDF(特别是扫描件做成的PDF)文件
推荐用下面软件转换
(1) 页数比较少的用 CAJviewer 7.0 (带OCR组件完整版), 支持直接打开PDF文件, 识别文字。 下载地址及详细介绍:
(2) 页数比较多的可以用 Readiris Corporate 12软件来进行识别 (需要安装亚洲语言包, 不然不识别中文)。 下载地址及详细介绍:
页数比较多的还可以用 ABBYY finereader 9或者9以上版本(有简体中文版)进行识别转换。 下载地址及详细介绍:。
这个软件的识别率很高, 转换出来的版面基本保持原样,还可以手动人工框选识别, 缺点就是识别速度较慢。
上面几个软件的识别率都还可以, 不建议用什么OFFICE组件识别, 太麻烦识别率也不高。
2、对于一些不允许做修改的PDF文件(就是加密加了权限的PDF), 那么就先要去除密码或者去除数字证书, 才能照上面两个步骤做。














