中小企业如何利用云计算提升数据分析能力,优化业务流程?
681
2022-05-30
本案例将详细介绍怎样用自动学习方法基于CAU地标数据集快速构建地标识别应用。将介绍如何订阅和标注CAU地标数据、并进行模型训练和部署。
ModelArts是一站式的AI开发平台。ModelArts自动学习具有零代码、零AI背景、泛化能力强的特点,用户无需编码,无需AI背景,就可以使用自动学习快速构建自己的AI应用。
准备工作
参考此文档,完成ModelArts准备工作。
准备数据
下载训练数据集
华为云AI市场中有开发者分享了丰富的数据集,大家可以前往订阅使用。本案例采用CAU地标数据集,数据集中有6个标志性地标(东校区主楼、西校区主楼、老校门、新图书馆、奥运摔跤馆和水塔)共49张图片。我们从华为云AI市场订阅数据集至ModelArts,然后就可以在ModelArts中使用了。
该数据集包含的地标及其类别如下图所示:
请点击此处,进入该数据集主页,点击【下载】,进入下载详情,按照如下提示填写下载详情:
下载方式:对象存储服务(OBS)
目标区域:华北-北京四
目标位置:选择一个OBS路径,作为数据集的存储位置。(具体创建桶过程可参考后面过程的步骤1)
等待数据集状态变为下载成功,即可在ModelArts数据集列表中开始创建数据集。
点击创建数据集
创建图像分类项目
步骤 1 点击此链接 ,创建一个OBS桶(区域选北京四,桶名称自定义,其他使用默认参数),然后在创建的OBS桶下创建一个文件夹/data-cau-landmark/data(点击桶名称->对象->新建文件夹)。创建OBS桶和文件夹参考文档:https://support.huaweicloud.com/qs-obs/obs_qs_0001.html 。
步骤 2 进入ModelArts自动学习界面。
步骤 3 点击“图像分类”创建项目按钮,创建自动学习>图像分类项目,填写相应参数,点击“创建项目”完成图像分类项目创建。
项目名称:自定义
数据集来源:已有数据集
数据集名称:‘创建的数据集名称’
图片标注
创建完项目 页面会自动跳转到数据标注界面。点击“同步数据源”按钮,等待右上角出现“数据同步完成”提示信息,可以看到界面显示的图像。共有49张未标注的图片和0张已经标注的图片。我们也可以将自己拍摄的图片上传到obs桶文件夹中进行同步来增大训练样本。
进入“未标注”页面。批量选中相同类别的图片,然后选择标签(如果标签不存在,需要手动输入),最后点击“确定”按钮。如下图所示(如果对操作流程不熟悉,可以查看右上角的“使用指南”):
“全部标签”中列举了所有的标签,以及每个标签下的图片数量。
校验图片标签。完成所有图片标注后,进入“已标注”页面。可以在“已标注”页面修改标签。如果标注正确,可以跳过此步骤。
点击打开图片,可以查看图片的标签,如下图所示:
如果发现标签不正确,可以选中图片,重新选择标签。
4. 模型训练
在“数据标注”界面中,首先把数据集按照训练集/验证集=0.8/0.2的比例分开,设置训练时长为10(减小训练时长的同时,可能会降低模型精度),然后点击“开始训练”按钮,选择好训练参数,即可开始训练。参数设置如下图所示:
5. 模型部署
在“模型训练”页面等待训练完成(不超过10分钟),训练完成后,可以查看模型的精度:
点击“部署”按钮,将模型部署为一个在线服务:
6. 服务测试
在“部署上线”页面,等待服务部署成功。部署成功后,点击“上传本地图片”按钮,上传一张本地的测试图片(从测试集test目录中挑选)。如下图所示:
点击“预测”按钮进行预测:
可以看到预测结果。若出现识别不准确可加大训练样本。
7. 关闭服务
在“部署上线”页面,点击“停止”按钮,停止在线服务,然后删除。
至此,CAU地标识别应用实验完成。恭喜各位开始在AI道路上迈出了一小步。欢迎各位把实战结果跟帖回复。
AI开发平台ModelArts 机器学习
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。