免费好用的OCR文字识别软件推荐(二)

   
 华南区技术负责人

概要
本文将继续详细介绍最为流行、免费的OCR文字识别软件,以及将PDF扫描件识别扫描转换成文字。方法其实也很简单,跟着小编一起学习吧!


一、免费专业的OCR文字识别软件

1、Free OCR

Free OCR是Windows OCR程序,是使用由HP创建并由Google维护的Tesseract引擎,OCR文字识别精准度较高。它除了可以很好地识别PDF扫描件之外,还支持TWAIN设备,例如数码相机和图像扫描仪。此外,它支持几乎所有已知的图像类型、传真文档和多页TIFF文件。该软件的操作界面简洁,简单易用。Free OCR软件支持的输出文本类型是纯文本,因此您只能是将文本复制到要粘贴的文档中。

支持的操作系统:Windows 2000/2003 / XP / Vista / 7 / 8 / 10

优点:
• 免费使用。
• 可以与任何类型的扫描仪一起使用。
• 它允许放大图像中的局部区域。
• Tesseract OCR引擎具有良好的准确性。

缺点:

• 只能识别PDF文档的首页。
• 每小时限制上传10张图片/文档。
• 仅支持文本输出。
• 不保留文本格式。

2、Easy Screen OCR

Easy Screen OCR是一款简单易用的PC屏幕截图OCR识别软件,其配备了强大的Google OCR引擎,可更为准确快速地将图片转换为可编辑的文本。与其他软件不同的一点是您无需上传任何内容,只需捕获屏幕的一部分内容,就可将其识别并复制其中的文本。另外,您还可以将其翻译为其他的语言。

该软件可支持识别全球100多种语言,支持20种语言的翻译。需要注意的是,该软件的最新版本(1.4.2及更高版本)在使用20次后需要付费。但是,该软件的旧版本仍然可以免费使用。

支持系统:Windows 10/8.1/8/7/Vista/XP、Mac系统。

优点:
• 易于使用。
• 支持两种OCR模式,在Google OCR模式下可识别100种OCR语言。
• 可将识别的文本直接翻译为其他语言。

缺点:

• 该OCR识别仅支持软件捕获的屏幕截图。
• 无法将提取的文本转换为其他文档格式。

3、gImageReader

gImageReader是Google OCR引擎tesseract的一个简单的Gtk / Qt前端,在使用该软件前,您还需下载并安装Tesseract。该软件可以对打印的文档和手写内容进行识别,同时您也可以选择手动或自动识别。该软件支持批量处理图片和文档。另外,在识别完成后,它会在旁边显示识别的文本图像,这样您可实时比较和修正。除此之外,它还提供了多种工具,比如拼写检查器等,方便您在后期对文本进行细致的检查。

支持的操作系统:Linux、Windows。

优点:
• Tesseract OCR引擎具有良好的精准度。
• 可以手动选择和调整OCR区域。
• 支持JPEG,GIF,PNG,TIFF图像、PDF文件输入。

缺点:

• 仅支持TXT文本输出。
• 不支持Mac系统。
• 需要安装新语言时,操作会比较复杂。

4、Free OCR to Word

Free OCR to Word软件是一个简单易用并具有基础功能的OCR程序,文本识别的精准度较高。它将纸质文档/图像转换为完全可编辑和可搜索的Word文档。而且它可以与所有主流类型的扫描仪相连接,使您可以直接将所有纸质文档,杂志,报告和表格扫描到该软件中,以进行图像到文本的转换。数字化文档后,可以方便您备份和共享文档。该软件支持从多种图像中提取文本甚至是不常见的图像格式,其中包括JPG / JPEG,TIF / TIFF,BMP,GIF,PNG,EMF,WMF,JPE,ICO,JFIF,PCX,PSD,PCD,TGA等。

支持的操作系统:Windows、Mac系统。

优点:
• 操作界面简洁,易于使用。
• 可以与所有主要类型的扫描仪连接。

缺点:

• 没有文字格式识别。
• 不支持PDF和多页文件。
• 无法设定文字语言,仅支持英语。

5、PDFMate PDF Converter

PDFMate PDF Converter是一款免费的PDF格式转换器,除了转换PDF格式之外,它还提供OCR识别功能。使用该OCR功能,您可将扫描的文件转换为可编辑的文本或Microsoft Word文件。在将扫描的PDF文件或图像添加到软件时,您需移至高级设置中以启用OCR。需要注意的是,该OCR功能是有限制的,只能识别不超过3页的文档。PDFMate PDF Converter软件还提供创建,编辑,转换和合并PDF文件的功能,以帮助您提高工作效率。

支持的操作系统:Windows、Mac系统。

优点:
• 支持批量转换,转换速度较快。
• 支持识别多国语言。
• 提供其他PDF编辑功能。

缺点:

• 只能识别3页以内的文档

二、如何将PDF的扫描件/图片转换为文字

上面已介绍了多种OCR软件,您可按照自身需求来选择其中一种。下面将以都叫兽™PDF转换软件为例,介绍PDF扫描件与图片转换成文字的具体操作步骤。

都叫兽™PDF转换器 – 高精准度的OCR文字识别功能

OCR功能 - 识别转换扫描的PDF以及图片

操作简单 - 新手能快速操作。

批量转换 - 转换率高达200页/分钟。

推荐下载:

  • PDF转换

    大小:33MB语言:简体中文

    系统:Windows 2K/XP/7/8/10

    长按复制:reneelab.com.cn/ddd 马上下载

1、将PDF扫描件转换成可编辑的文件格式

具体的操作步骤如下:

① 安装好软件后,点击“转换PDF”。

② 点击“添加文件”,导入扫描的PDF文件。

③ 点击要转换的文档格式,如“Word”。然后选择软件左下角的“启用OCR”,然后选择一种OCR文字识别模式,例如“A:识别图片或者PDF扫描件里的文字”。

选择启用OCR后,都叫兽™ PDF转换软件会提供三种OCR文字识别模式,您需选择其中一种:

• A:识别图片或者PDF 扫描件里的文字:这个选项就默认PDF页面的文字都是在图片/扫描图上,程序会直接使用OCR功能(选择对应的语言效果会更佳)识别文件上的文字然后转输出。

• B:识别内置字体(避免乱码):这个选项默认PDF页面的文字都是使用内嵌字体,程序会将这些字体转成图片,再使用OCR功能(选择对应的语言效果会更佳)识别文件的文字转换输出。

• A+B(更慢):程序自动识别文件内的字体是图片还是PDF内嵌字体,然后再进行转换输出。但是识别比较耗时,转换的时间也会更加长。

④ 最后,选择文件的保存位置,点击“转换”即可完成操作。

2、将图片转换成可编辑的文件格式

具体的操作步骤如下:

① 同样的进入步骤,选择“PDF转换”后,直接点击“OCR”功能。

② 点击“添加文件”,添加要转换的图片,然后在输出设置下,选择输出文件的保存位置。

③ 点击“OCR语言”,选择与图片所相应的语言;还有选择图片方向。

④ 最后,点击“转换”。该软件默认转换的文档格式为TXT格式。

总结

这篇文章与上一篇文章总共介绍了9款免费的OCR文字识别软件,每个软件自身都存在着一定的优势和劣势。但是在功能多样性与文字识别准确率上,都叫兽™PDF转换软件相比其他OCR文字识别软件要更加优秀。如果您还需要转换PDF文件格式或编辑PDF文件,那都叫兽™PDF转换软件也能提供帮助。


都叫兽结语:

今天的分享就到这里,希望能给你带来帮助,记得给我们转发点赞哦!想要获取更多资讯和干货,请关注都叫兽软件熊掌号。



推荐阅读

分享到: