从图片中读取文字、把图片转换成文本格式(用word附带功能就能做到)

上传人:宝路 文档编号:3106548 上传时间:2017-07-30 格式:DOC 页数:5 大小:576.01KB
返回 下载 相关 举报
从图片中读取文字、把图片转换成文本格式(用word附带功能就能做到)_第1页
第1页 / 共5页
从图片中读取文字、把图片转换成文本格式(用word附带功能就能做到)_第2页
第2页 / 共5页
从图片中读取文字、把图片转换成文本格式(用word附带功能就能做到)_第3页
第3页 / 共5页
从图片中读取文字、把图片转换成文本格式(用word附带功能就能做到)_第4页
第4页 / 共5页
从图片中读取文字、把图片转换成文本格式(用word附带功能就能做到)_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《从图片中读取文字、把图片转换成文本格式(用word附带功能就能做到)》由会员分享,可在线阅读,更多相关《从图片中读取文字、把图片转换成文本格式(用word附带功能就能做到)(5页珍藏版)》请在金锄头文库上搜索。

1、超简单从图片中读取文字的方法(使用 word 自带软件)(全文原创,转载请注明版权。本文下载免费,如果对您有一定帮助,请在右边给予评价,这样有利于将本文档位于百度搜索结果的靠前位置,方便本方法的推广)【本文将介绍读取图片中的文字、读取书中文字、读取 PDF 格式文件中的文字的方法】一、背景看到图片中满是文字,而你又想把这些文字保存下来,怎么办? 日常读书,某篇文章写的极好,想把它分享到网络上,怎么办?一个字一个字敲进电脑?太麻烦了。是不是希望有一种东西能自动识别读取这些文字?是的,科技就是拿来偷懒的。其实你们电脑中安装的 word 早就为你考虑过这些问题了,只是你还不知道。二、方法1、图片格式

2、转换只有特定格式的图片才能读取文字,所以要转换。大家常见的图片格式都是 jpg,或者 png,bmp 等,用电脑自带的 画图 软件打开你要获取文字的图片(画图软件在 开始所有程序附件 中,win7 用户直接右击图片,选择 编辑 ,就默认使用画图软件打开图片) ,然后把图片另存为 tiff 格式。(以我的 win7 画图为例。另存为 tiff 格式如下图)2、打开读取文字的工具开始所有程序Microsoft Office Microsoft Office 工具Microsoft Office Document Imaging(本文全部以 office2003 为例。另外,有些人安装的是 Offi

3、ce 精简版,可能没有附带这个功能,那就需要添加安装一下,安装步骤见文末 注释 )3、导入 tiff 格式的图片在 Microsoft Office Document Imaging 软件界面中,选择 文件导入,然后选择你刚才存放的 tiff 格式的图片,导入。4、文字识别点击下图橙色方框圈中的图标,进行 OCR 识别,就是让软件把图片中的文字读取出来(图片中文字越多,识别花费的时间越长,进行识别完成之后,左边缩略图框中会有一个眼睛的标志,如图红色箭头所指) ;点击下图橙色椭圆圈中的图标,就能将整个图片中的文本发送到 word。5、也可以选择图片中的部分文字。首先还是要点击 OCR 识别(如果

4、上面已经识别过,就不用再识别一次了,具体看有没有眼睛标志) ,然后点击下图中左上角菜单中的 箭头 ,就可以自由拖动选择文字、图片,右击选择框,就可以复制文本、图片或者将选中的文字发送到 word。6、展示一下识别效果7、重要说明一般来讲,图片清晰、对比鲜明的时候,该软件对文字的识别率在 95%以上,但不能保证 100%。为保险起见,还是要人工核对一下识别的结果,尤其是格式特别复杂、有特殊文字、特殊符号的地方。识别率与图片清晰度、文字大小、文字的端正程度、文字与底色的对比程度有关。不要指望你用肉眼都看不清楚或者不能分辨的文字可以用该软件识别出来。该软件的原理是使用扫描的文本字符与系统内置的字符形

5、状、语言辞典进行比较,从而识别文字,只能扫描指定的语言,其他语言不能识别。要更改使用的扫描语言,在“工具”菜单下选项OCR 选项卡OCR 语言,选择你要使用的语言。一般默认使用的语言跟你 word 的默认语言相同,因此没有特殊要求,不必更改。现在网上有许多这方面的专门软件(百度一下 OCR 就出来了) ,使用的基本原理都是 OCR,但人家既然号称 “专业” ,可能功能更强大一些(比如支持更多语言) 、识别率更高一些(具体是不是,我没用过,也不知道,感觉 word自带的这个就够用了) ,而且,他们大都需要付费,我就看到一款在淘宝卖的,叫价 69 元(淘宝网址可以参见文末 注释) 。三、其他读取文

6、字的需要1、读取书上的文字可以把书上的文字用像素较高的相机照下来,注意照片要端正,尽量清晰,白纸黑字对比鲜明的照片最好,然后对照片执行以上操作。2、读取 PDF 文件用 Adobe Reader 打开 PDF 格式的文件:如果读取全文,在 Adobe Reader 中单击 文件打印 ,将“打印机”设置为“Microsoft Office Document Image Writer”,单击打印,默认输出 tiff 格式虚拟打印文件(也可以设置为输出 mdi 格式的文件) ,然后对输出的 tiff 格式文件或者 mdi 格式文件执行以上读取文字的操作;如果读取部分文字,翻到你需要的文字所在页面,摁

7、下 PrScrn 键(有抓取屏幕图像的功能) ,然后打开 Microsoft Office Document Imaging,在左侧窗口中单击右键,选择“粘贴页面” ,就能把刚才 PrScrn 键抓取的整个屏幕粘贴到Document Imaging 中,然后执行以上读取文本的操作。需要说明的是,现在 PDF 转 word,有更多更方便的方法了。一是现在大家使用的新版的 Adobe Reader,其本身就能把 pdf 页面中的文字转换成文本文档;二是同方知网独创的 CAJViewer 软件(免费) ,一般被用来阅读知网的论文使用,也可以阅读 PDF 格式的文件,对 PDF 文本的操作功能更多;三

8、是上网转换,百度一下“pdf to word ”,就有许多免费的软件和许多免费的在线网站提供转换服务(网站大多是英文的,但也很简单理解) ,能一步到位把 PDF 全文转换为 word 格式。四、科普一下OCR,optical character recognition ,通过光学技术对文字进行识别,当有大量文字需要录入电脑的时候,如果能有计算机自动完成,要比人工录入快很多,且节省人力和时间。OCR 软件需要光学输入设备(如扫描仪,数码相机等)的配合,构成 OCR 系统。Microsoft Office Document Scanning 组件,便于用户通过扫描仪将文档扫描到计算机;Micros

9、oft Office Document Imaging 组件,便于用户在计算机屏幕上查看扫描的文档、重拍多页文档、选择识别的文本并操作等等。电子文本是指带有文字的图片或者电子书籍(指诸如 pdf 格式的书籍而并非 txt 格式的电子书) ,用户需要从中提取文字。导入电子文本的方式有两种,扫描文档和导入 Tag 图像文件(tiff ) 、Microsoft Document Imaging 文件(mdi) 。注释: 添加 Office OCR 工具的方法(以 office2003 为例):使用 office2003 安装软件的“添加或删除功能(A) ,更改已安装的功能或删除指定的功能”选项,安装该组件,单击下一步;勾选“选择应用程序的高级自定义”选项,单击下一步;打开“office 工具”“Microsoft Office Document Imaging”,选择安装“扫描、OCR 和索引服务筛选器”和“Microsoft Office Document Image Writer” ,单击更新;最后重新启动计算机使更改生效,然后就能启动 Microsoft Office Document Imaging。 软件的淘宝网址 http:/ ;关于该软件的使用方法,百度经验中有:http:/ 夜

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 试题/考题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号