市场几款热门OCR文档识别工具测试结果对比

网友投稿 974 2022-05-29

OCR文档识别,是专门用于识别复印、手写文档并转化为可编辑的电子文档的一种技术,也是当代日常办公学习必不可少的“趁手”工具之一。

选择一款高效的OCR识别工具,可以大大提升文档电子化录入效率。目前,国内不少人工智能识别技术研究公司推出OCR应用平台,使更多的人得以享受OCR技术带来的便利。

上图是国内应用市场上几款热门文档识别工具以及他们的测试结果,主要测试不同OCR技术在面对模糊图片、清晰图片时候的表现结果以及所需的平均时长。

市场上几款热门OCR文档识别工具测试结果对比

在图片模糊(像素较低)的情况下:

腾讯优图、易道、云脉三方表现良好,识别率均达到了91.58%以上,其中云脉最高,识别率高达94.15%;文通、ABBYY表现令人大跌眼镜,文通识别率甚至不足50%。

在图片模糊(像素较高)的情况下:

腾讯优图、易道、云脉三方依然表现良好,易道、云脉识别率均达98%以上,区别在于云脉OCR深度学习平均用时远低于易道和腾讯优图,平均用时仅需2.11s。

在OCR技术测试过程中我们发现:

①在符号问题中,腾讯优图、百度云、易道均存在中英文全角半角混淆、符号识别错误、 句末符号漏识别等问题。

②ABBYY、文通在光线暗、模糊、小字体等情况下,容易识别成乱码或识别全错,拉伸、压扁字体,出现整行漏识别。

③易道断笔字情况下,容易识别错误,识别时间较长。

文档识别http://www.yunmai.com/

文字识别 OCR

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:XML DOM 节点类型
下一篇:每个程序员都应该知道的50个Web开发术语
相关文章