pdf文字怎么识别

如题所述

第1个回答  2019-08-15

通过扫描得到的PDF文档,其中的文字都是图片格式的。如图中文件,诗词,看起来 全是文字,但其实是图片,不能复制黏贴,也不可以编辑。需要通过文字识别工具,将其转换为可识别文档。

工具原料:
福昕高级PDF编辑器

方法/步骤:


1.打开PDF文档,选择工具“转换->OCR->当前文件”。


2.在弹出的属性设置中,选择要识别的页面范围,语言要选择当前文档中包含的语言中,默认是勾选“简体中文”和“英文”。


3.PDF文档文字识别有两种结果,一种是只可以搜索文本信息,保留当前排版;另一种是即可搜索文本信息,还可以编辑文本信息。


4.同时,在当前设置中,还可以勾选“查找所有疑似结果”。若有勾选,会在识别完成后,提示所有疑似结果。


5.文字识别完成后,程序会自动提示,“OCR识别疑似错误”,如果确实识别有错误,可以手动输入正确内容。


6.确认完所有 “OCR识别疑似错误”后,即可得到可编辑的PDF文档。

注意事项:
如果文档中,包含其他的语言,一定要记得勾选相应的语言信息。

第2个回答  2023-05-25

第一步:首先我们打开【迅捷OCR文字识别软件】软件,然后在批量识别服务区域找到【PDF文档识别】选项,然后点击【添加文件】或者【添加文件夹】选项添加需要提取文字的PDF文档。当然我们也可以选择使用拖拉的方式导入PDF文档。

如果你的PDF文档很多,可以提前建立一个文件夹,然后将所有的PDF文档全部放置在文件夹内,最后点击【添加文件夹】选项即可一键添加所有需要转化成文字的PDF文档啦!

第二步:导入PDF文档之后,我们需要做的就是通过页面左下角设置好它的导出模式然后点击【一键识别】选项即可识别。

除了可以识别PDF文档,这款软件还有很多好用的软件,比如:图片转PDF。它的具体操作如下:

第一步:打开软件后我们点击【图片转PDF】选项。随后在右边区域点击【添加文件】或者【添加文件夹】选项就可以导入所有需要转换的PDF文档了。

第二步:导入图片选择导出模式,最后点击【一键识别】选项即可。

相似回答