如何将书上的文字转换成word

如题所述

用软件尚书七号完成该工作。

尚书七号是一款专门为识别文字而研发的软件,尚书七号是应用OCR技术,为满足书籍、报刊杂志、报盘票据、公文档案等录入需求,实现系统管理方式而设计的软件系统。尚书七号OCR软件是MICROTEK中晶科技公司,向汉王科技购买授权,赠送给用户使用的软件,适用于个人、小型图书馆、小型档案馆、小型企业进行大规模文档输入、图书翻印、大量资料电子化的软件系统。 
简繁字集:除了简体汉字外,还可以混识台湾繁体字5400多个以及香港繁体字和GBK汉字。
识别字体种类:能识别宋体、仿宋、楷、黑、魏碑、隶书、圆体、行楷等一百多种字体,并支持多种字体混排。 
识别字号 初号 小六号字体。 
表格识别 可以自动判断、拆分、识别和还原各种通用型印刷体表格。 
可支持繁体WINDOWS系统 
直接运行程序setup.exe,根据安装向导的提示,就可以完成安装操作。 
1、将书进行拍照或是扫描成图片文件(尽量高清一点,方便后续第二步骤);

2、需要上网找“尚书七号”一类的文字识别软件:安装完毕之后,首先把图片上的文字识别出来,然后再对照图片把识别错误的地方改过来,这样就实现了,从书上的文字转换成word了。

2.1、打开尚书七号,选择打开图象。

  
2.2、选择开始识别或按F8。识别结果将显示在窗口上部,下部显示版面分析结果。其中红线为可识别部分,绿线为不可识别。   
2.3、选择输出--到指定格式文件,将识别结果保存为需要的格式。
用扫描仪扫描的文字图像,不能对个别文字进行编辑修改,在教学中,需要利用文字识别软件,将文字图像进行识别,将图像格式转化成文本格式,常见的文字识别软件有很多,主要功能基本相同,尚书七号就是其中很优秀的一款。用尚书七号对文字图像识别转化的过程,利用其主菜单:“文件”、“编辑”、“识别”、“输出”可以很方便地完成。具体步骤为: 
步骤1:获取文字图像文件。 
选择“文件”菜单下的“扫描”或“打开图像”(将已经扫描好的图像文件打开)命令,打开图像文件。如果连接了多台扫描仪,可以选择“文件”菜单下的“选择扫描仪”命令,调用扫描仪。 
步骤2:对扫描的图像页进行调整 
选择“编辑”菜单下“图像页面的处理”子菜单下的“图像页的倾斜校正”(提供自动和手动实现方法)及“旋转”等命令,将扫描的图像页进行调整。 
步骤3:版面分析与文字识别转化 
版面分析,选择识别范围,在进行文字识别前要选择识别范围,识别过程的核心是“版面分析”。尚书七号的自动版面分析功能很强,对报纸杂志等复杂的版面,也能保持很高的分析正确率。 
设置好后,直接点击“开始识别”的按钮就可以进行文字识别了。 
步骤4:校对修改 
自动识别完毕,识别结果的“文本窗口”会弹出,这个窗口能够提供识别结果的校对,为了校对方便,尚书七号增加了光标跟随显示原图像行的校对方法(如图3出现的黄色提示行的出现)。 
提供的校对方法,一眼就能够看到图像原文和识别出文本的差别,如果发现识别有误,可以进行修改。 
步骤5:输出 
如果检查修改后确认无误,选择识别结果的“输出”菜单,输出的文件格式有:RTF、HTML、XLS、2126,可以根据自己的需要选择对应的格式。如果用户想得到类似原文的识别结果,请选择RTF格式。把RTF格式输出的文件用WORD打开后,会发现几乎保留了原文的所有痕迹,包括原来页面中的彩色图像,都已经保留在WORD中了。

温馨提示:答案为网友推荐,仅供参考
第1个回答  2019-03-08

将书上的文字转换成Word文档,可以试试下面这个方法:

1、先将书本上的文字拍下来,再将图片导入到电脑上,打开电脑上的ocr文字识别软件,点击左侧的图片局部识别这个功能。

2、进入图片局部识别版块后,点击添加文件按钮,将所需识别的图片添加进来。

3、接着点击框选工具,拖动鼠标在图片上将所需识别的文字框选出来,软件将会自动执行识别的命令。

4、识别完成后,识别出来的结果会呈现在右侧的框内,可点击导出识别结果。

相似回答