光学字符识别,又名OCR,是一种将文本图像转换为可编辑文本的技术。 这项技术已经存在了很长一段时间,最早可追溯到Windows 3.1时代,是大多数人在办公场所使用的技术。 就使用位置而言,OCR通常包含在传真软件包中。 可以扫描的传真机可以扫描整个页面,然后将图像转换为可编辑的文本。
最长的时间,OCR不仅是软件而且是硬件的付费领域,但是如今,即使没有扫描仪,OCR也是免费和容易的。
两种免费的OCR方法
SimpleOCR是一个完全启用的免费OCR程序,只需几分钟即可完成设置。 下载,安装并继续。 在下载之前,您可以在这里阅读更多信息。 SimpleOCR的准确性高达99%,并且可以在从'95到现在的Windows版本上使用。 是的,它确实可以在Windows 95中运行,足够令人惊讶了。
上个月,谷歌宣布其Google Docs产品现在具有OCR功能。 由于大多数更好的OCR程序都适用于Windows,Linux和Mac,因此人们现在可以通过使用Google获得不错的免费选择。 尚不清楚使用OCR时Google Docs的转换准确率如何,但假设它相当不错。
使用数码相机代替扫描仪扫描文本图像
扫描的页面是OCR的最佳图像类型,但是如果没有扫描仪,则只要正确拍摄照片,就可以使用数码相机。
怎么做很容易。
- 将打印的纸和大头钉或胶带拿到墙上。
- 在保持焦点对准的同时,尽可能近地拍摄一张照片。 三脚架在这里有很大帮助。 您可能还需要使用“特写”选项以获得更好的聚焦。
- 将图像发送到SimpleOCR或Google文档进行转换。
拍摄打印纸的照片时,请保持角度完全平坦(如“向前看”纸一样)。 如果您以一定角度拍摄照片,则OCR很难将图像文本转换为可编辑文本。
还建议您将发送给OCR的任何照片的宽度至少定为3, 000像素。 OCR必须使用的像素越多,正确转换图像的机会就越大。
如果您不能从数码相机方法中获得很好的结果,而宁愿使用传统的USB平板扫描仪,则可以使用很多产品,新产品的起价约为75美元(翻新/二手产品的起价约为50美元)。