图片型PDF文件的OCR识别方法
来源:百度文库 编辑:神马文学网 时间:2024/10/03 02:49:29
本方法适用于扫描所得的图片型PDF文件的文字识别。
1.工具:microsoft office document imaging(见Office 2003 工具)、Windows程序附件中的“画图”板。
2.图片文件格式:.tif(即Tag图像文件格式,tiff)
3.步骤:
A.在PDF文件中使用快照工具,选中需要识别的区域。提示“选定的区域已复制到了剪贴板”,点击“确定”。
B. 打开“画图”板,“开始--程序--附件--画图”,然后点“编辑--粘贴--文件--另存为”,在保存类型中选择Tiff,然后“保存”。
C.用microsoft office document imaging打开保存的tif文件,“开始--程序--Microsoft office--microsoft office工具--microsoft office document imaging”,接下来有两种方法:1)点“工具--使用OCR识别文本”,然后在运行过OCR的页面上直接复制文字粘贴到Word中即可进行编辑。2)点“工具--将文本发送到Word”,去掉“在输出时保持图片版式不变”前面选择框中的“√”,然后确定,在弹出的Word中选择文字即可进行编辑,识别完成。
4.注意事项:
A.PDF原稿越清晰识别效果越好,建议放大到200%使用快照工具。
B.其他格式图片应先转换为tif格式,用“画图”板打开然后另存就可以。
C.使用快照工具时选区边界尽量放宽,避免靠边的字无法正确识别。
D.支持跨栏选择的文字,识别后段落正常。
E.使用快照工具时,避免一次选择太大范围,造成死机。
F.如果识别后全为乱码,注意microsoft office document imaging的OCR选项是否为相应语言,“工具--选项--OCR--OCR语言(中英文选择)--确定”。
1.工具:microsoft office document imaging(见Office 2003 工具)、Windows程序附件中的“画图”板。
2.图片文件格式:.tif(即Tag图像文件格式,tiff)
3.步骤:
A.在PDF文件中使用快照工具,选中需要识别的区域。提示“选定的区域已复制到了剪贴板”,点击“确定”。
B. 打开“画图”板,“开始--程序--附件--画图”,然后点“编辑--粘贴--文件--另存为”,在保存类型中选择Tiff,然后“保存”。
C.用microsoft office document imaging打开保存的tif文件,“开始--程序--Microsoft office--microsoft office工具--microsoft office document imaging”,接下来有两种方法:1)点“工具--使用OCR识别文本”,然后在运行过OCR的页面上直接复制文字粘贴到Word中即可进行编辑。2)点“工具--将文本发送到Word”,去掉“在输出时保持图片版式不变”前面选择框中的“√”,然后确定,在弹出的Word中选择文字即可进行编辑,识别完成。
4.注意事项:
A.PDF原稿越清晰识别效果越好,建议放大到200%使用快照工具。
B.其他格式图片应先转换为tif格式,用“画图”板打开然后另存就可以。
C.使用快照工具时选区边界尽量放宽,避免靠边的字无法正确识别。
D.支持跨栏选择的文字,识别后段落正常。
E.使用快照工具时,避免一次选择太大范围,造成死机。
F.如果识别后全为乱码,注意microsoft office document imaging的OCR选项是否为相应语言,“工具--选项--OCR--OCR语言(中英文选择)--确定”。
图片型PDF文件的OCR识别方法
图片型PDF文件的OCR识别方法1
图片型PDF文件的OCR识别方法2
图片型PDF文件的OCR方法
各种格式文件ocr成word文件的方法
扫描下来的 PDF 文件如何做文字修改(OCR)?【转】 - niya的日志 - 网易博客
PDF转换DOC文件的方法
破解PDF文件安全设置的方法
PDF文件分割方法
Word文件与PDF文件的转换方法
各种格式文件ocr成word文件的方法 - 绿色软件联盟 - 绿色免费共享
利用word将PDF转换DOC文件的方法 --电脑高手
【电脑】破解PDF文件安全设置的方法
破解PDF文件安全设置的方法2
在线转换和阅读PDF文件的方法
利用word将PDF转换DOC文件的方法--
改变PDF文件背景颜色的一个方法
将图片中的文字提取出来、将PDF文件转换成word文档以及将图片中的网址和文字去掉的方法
识别病毒文件的四个非常不错的方法
识别病毒文件四个非常不错的方法
CAJ文件的识别
Word,PDF,PPT,TXT之间的转换方法 附带图片
Word,PDF,PPT,TXT之间的转换方法 附带图片
小软件帮你轻松提取PDF文件里的图片