让你的摄像头变成文字扫描器

资源描述

《让你的摄像头变成文字扫描器》由会员分享，可在线阅读，更多相关《让你的摄像头变成文字扫描器（7页珍藏版）》请在金锄头文库上搜索。

1、现在视频聊天是网友们最喜爱的沟通方式了，因此大家对摄象头再熟悉不过。摄象头除了视频聊天之外还有很多丰富的功能，比如：拍照片，拍大头贴，摄象等等。今天给大家介绍一下摄象头的“另类”功能文字扫描。打开“开始Microsoft officeMicrosoft office 工具Microsoft office Document Scanning”，如果该项未安装，系统则会自动安装。安装完成后会弹出扫描新文件对话框，单击扫描仪按钮，在弹出的对话框中选中摄像头，并选中“在扫描前显示扫描仪驱动”复选框，再选中“黑白模式”，并选中“换页提示”和“扫描后查看文件”两项。然后单击扫描按钮即可进行扫描，在扫描过

2、程中会弹出一个对话框，选中格式按钮，然后在“输出大小”中选择 600480 分辨率，然后将文稿放平，反复调节摄像头的焦距和位置，使画面达到最佳效果，点击捕获按钮即可得到图片画面，该图片会显示在“图例”框中，然后选中该图片，点击发送按钮会开始扫描该图片中的文字，扫描完成后点完成按钮，然后系统会自动打开识别程序 Microsoft Office Document Imaging，用该文件就可以识别了。完成后可以选中全文，鼠标右击后选中“将文本发送到 Word”项，则所选内容便会被 Word 打开并可以进行编辑了。微软白送的微软白送的 OfficeOffice 20032003 OCROCR 文字识

3、别文字识别工具工具单位准备把原来重要的文档全部电子化，储存在电脑中，如果把所有文件扫描为图像，又不方便文件检索，重新输入文本有太浪费时间，最近发现 Office 2003 中集成了先进的文字识别功能（简称 OCR），下面就一起来体验一下吧！首先将扫描仪安装好，接下来启动“Microsoft Office/ Microsoft Office 工具/Microsoft Office Document Scanning”即可开始扫描（如图 1）。提示：Office 2003 默认安装中并没有这个组件，如果你第一次使用这个功能可能会要求你插入 Office2003 的光盘进行安装。由于是文字扫描通常

4、我们选择“黑白模式”，点击扫描，开始调用扫描仪自带的驱动进行扫描。这里也要设置为“黑白模式”，建议分辨率为 300dpi。扫描完毕后回将图片自动调入 Office 2003 种另外一个组件“Microsoft Office Document Imaging”中（如图2）。点击工具栏中的“使用 OCR 识别文字”按键，就开始对刚才扫描的文件进行识别了。按下“将文本发送到 Word”按键即可将识别出来的文字转换到 Word 中去了。如果你要获取部分文字，只需要用鼠标框选所需文字，然后点击鼠标右键选择“将文本发送到 Word”就将选中区域的文字发送到 Word 中了（如图 3）。用用 OCROCR

5、软件进行扫描识别文本的小技巧软件进行扫描识别文本的小技巧责任编辑：任仲【转载】网络收集 07 年 12 月 17 日暂无评论扫描仪的一个重要功能就是通过 OCR 软件（即文字识别软件）将扫描后的文字图像转换成文本格式的文件，使文字处理软件能够调用处理。这样可以大大提高文字录入速度，极大地提高工作效率。目前，文字识别软件主要有尚书 OCR、汉王 OCR和紫光OCR等几种。不过，我们在进行文字识别时经常会遇到识别率低的问题，其原因除了被识别稿件有问题外，主要还是我们没有掌握好扫描及 OCR 识别软件的使用技巧。那么进行文字识别时有哪些技巧呢？一、根据识别稿的质量进行处理一、根据识别稿的质量

6、进行处理进行扫描识别时，在可能的情况下应尽量选择清晰度与洁净度都很高的识别稿，识别稿的清晰度与洁净度的不同会使扫描后的识别率有很大差距。对一般的印刷稿、打印稿等质量较好的文稿进行识别，只要掌握好方法与技巧，其识别率一般可达到 98以上。而对报纸、杂志等清晰度不佳的原稿进行识别，无论使用何种识别软件都难以达到很高的识别率。1.对一些带有下划线、分隔线等符号的文本原稿，有些 OCR 软件是识别不出的，一般会出现乱码。如果必须扫描带有这些符号的原稿，一是要确保使用的识别软件能够识别这些符号。二是使用工具擦掉这些特殊符号，使识别软件能正确识别这些文字。如果扫描后的文档中含有 OCR 软件不能识别的图像

7、、图形和一些特殊符号，可以考虑使用“擦拭”工具将文档中的图像、图形和一些特殊符号擦除，同时将图像上一些杂点也一并去除。使图像中除了文字没有多余的东西，这可以大大提高识别率并减少识别后的修改工作。2.在扫描识别报纸或纸张较薄的文稿时，扫描时稿件背面的文字通常会透过纸张造成错字或乱码，使识别率大大降低。在对这类原稿扫描时，我们可以在原稿的背面覆盖一张黑纸，在进行正式扫描时，适当增加扫描对比度或亮度，即可有效提高识别率。3.对于一些图文混排的原稿，扫描成一幅图像进行全区识别会严重影响 OCR 软件的识别率。我们可以根据实际情况将扫描后的版面切分成多个区域后再识别，切分区域的原则是：将图形、图像排除在

8、区域之外（图 1），尽量把文字字体、字号一致的划在一个区域内，不要嫌这个过程烦琐而选用自动切分区域，手动选取扫描区域会有更好识别效果，还应注意各识别区域不能有交叉情况。图 1 版面切分二、扫描识别稿的操作技巧二、扫描识别稿的操作技巧1.首先要保持工作环境的清洁，扫描仪的玻璃板以及若干个反光镜片及镜头，其中任何一部分脏污都会影响扫描文字图像的效果。因此，保持扫描仪的清洁是确保文字图像扫描质量及识别率较高的重要前提。2.扫描仪在刚开启时，光源的稳定性较差，而且光源的色温也没有达到正常工作所需的色温，所以开始扫描以前最好先让扫描仪预热一段时间。3.在放置扫描原稿时，把扫描的文字材料摆放在扫描起始线正

9、中，可以最大限度地避免由于光学透镜导致的失真而影响识别率。4.扫描后的文字图像经常会有一定角度的倾斜，出现这种情况必须在扫描后使用自动或手动旋转工具进行纠正，OCR 软件一般都设有自动纠偏和手动纠偏工具。否则 OCR 识别软件会将水平笔画当作斜笔画处理，识别率会下降很多。如果扫描后的文字图像倾斜角度超过 15，倾斜校正会产生较大的失真和误差，从而严重影响识别率，这种情况建议摆正原稿重新扫描。三、扫描参数的设置三、扫描参数的设置扫描参数的设置主要包括分辨率的设置及亮度和对比度的设置。1.一般来讲，分辨率越高识别率也就会越高。但这也不是绝对的，对于一些过大过粗的字体，设置过高的分辨率，识别率可能会

10、降低，而且设置高分辨率后，扫描速度会大大降低。根据实际经验，1、2、3 号字的文稿推荐使用 200dpi，4、小 4、5 号字的文稿推荐使用 300dpi，小 5、6 号字的文稿推荐使用 400dpi，7、8 号字的文稿推荐使用 600dpi（图2）。图 2 选择分辨率2.扫描时适当地调整好亮度和对比度值，对识别率的高低影响很大，在进行扫描亮度和对比度的设定时（图 3），以扫描后的图像中文字的笔画较细、均匀，且没有明显断点为准。如果扫描后的文字图像存在黑点、黑斑或文字线条很粗很黑，分不清笔画，说明亮度值太小，应该增加亮度值再重新扫描。如果文字线条凹凸不平，有断线甚至图像中汉字轮廓严重残缺时，说

11、明亮度值太大，应减小亮度后再重新扫描。如果要扫描质量比较差的文稿，比如报纸，扫描出的图像可能会出现大量的黑点，而且在字体的笔画上也会出现粘连现象，为获得较好的识别结果，必须仔细进行亮度和对比度值的调整，反复扫描多次才能获得比较理想的效果。图 3 扫描亮度和对比度的设定四、识别后的处理工作四、识别后的处理工作1.文字校正文字校正是 OCR 识别工作中比较烦琐的一步。一般 OCR 软件对可能出现错误的文字，会显示出蓝色标记，请用户确认。但在没有提示出错的地方，也有可能出错。所以大家在校对时应该通读一遍，以提高文字录入的准确率。2.识别后文本的保存如果把识别后的文本简单复制粘贴到 Word 中保存处理，就需要去掉多余的硬回车，这样会非常麻烦。正确方法是：先将识别后的文本存盘，在存盘时设置为软回车就行了。对于紫光 OCR，则需要在识别完成后，选择文件菜单下的导出命令，将存储类型选为TXT，段内回车字符选为无。注意：一定不要直接存盘，否则不能自动去掉文章的硬回车。尚书 OCR、汉王 OCR和紫光 OCR都提供了段内去除硬回车的功能。

展开阅读全文