使用华为云鲲鹏部署Tesseract 工具,教你十分钟搞定上万字的文字识别,千万不要错过!

网友投稿 756 2022-05-30

看视频,还可参与回帖互动领好礼活动!快来参与吧:

https://bbs.huaweicloud.com/forum/thread-63290-1-1.html

文字识别在生活中应用的场景很多,比如常见的汽车牌照识别,实名认证中对于身份证ID的自动识别,输入法的手写识别等等。

实现文字识别的途径主要有三种,一个是我们自己手写代码,二是使用开源代码,三是调用云厂商的云服务。

第一种,我们自己手写代码难度较大。

第二种,给大家介绍。

第三种,调用云服务的方式。

最常用的文字识别引擎之一,就是目前由google维护的tesseract文字识别引擎,并且是开源的。

tesseract地址:https://github.com/tesseract-ocr/tesseract

我的tesseract是部署在云服务器上,当然大家也可以在本地电脑下载编译tesseract,没有任何差别。放在云服务器的好处就是,在其他任何城市使用任意一部手机或者电脑就可以远程使用该文字识别功能,不用重新配置。否则每个新设备都要重新配置编译tesseract,非常麻烦。

获取鲲鹏弹性云服务器

浏览器搜索“华为云”进入华为云官网,注册并且实名认证。

获取途径有两个,一是免费试用,二是购买使用

免费试用点击:首页->免费试用,选择 鲲鹏弹性云服务器KC1,每个账号只能免费试用一次。

购买使用点击:产品->弹性云服务器ECS,选择通用计算增强型KC1

获取成功后,点击控制台->弹性云服务器ECS,就可以看到我们的鲲鹏弹性云服务器,并且可以远程登录进行操作。系统装的是CentOS,用linux指令操作,也可以装windows系统,但是要购买2G内存以上的规格。

使用华为云鲲鹏部署Tesseract 工具,教你十分钟搞定上万字的文字识别,千万不要错过!

部署tesseract

华为云官方文档:https://www.huaweicloud.com/kunpeng/software/tesseract.html

部署的本质就是下载tesseract源代码以及依赖库,然后使用编译器编译生成可执行文件, 该可执行文件就可以直接识别文字图片了,原理非常简单。

华为云官网为我们提供了完整的部署步骤。

可以通过华为云端实验室练习部署过程。首页点击开发者->云端实验室,找到使用华为云鲲鹏弹性云服务器部署文字识别Tesseract实验。点击开始实验,整个过程直接复制粘贴左侧的指令,依次执行即可。整个过程与在云服务器操作一样。

OCR 鲲鹏

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:Vue进阶(二十八):浅析Vue中computed与method的区别
下一篇:华为软件开发云发布管理测评报告
相关文章