如何快速准备高质量的视频标注数据?

网友投稿 920 2022-05-30

如何快速准备高质量的视频标注数据?

随着AI的快速发展,如何快速准备大量高质量的数据已经成为AI开发过程中一个极具挑战性的问题!随着视频监控、抖音等短视频APP的快速发展,视频数据越来越多,应用也越来越广,比如人脸识别门禁、人脸识别考勤、交通违规识别、智能交通等,这些AI技术的应用离不开视频及其标注数据的准备。本教程将基于视频类型的数据集,指导您如何使用华为云ModelArts对视频类数据进行快速标注,得到高质量的视频标注数据。标注后的数据集,经过发布即可用于模型训练和部署AI应用等。

数据准备

参考此文档,完成ModelArts准备工作。包括注册华为云账号、ModelArts全局配置和OBS相关操作。

ModelArts产品地址。可以边看博客边实际操作:https://console.huaweicloud.com/modelarts/?region=cn-north-4#/dataset

下载数据

此次体验数据包含9个短视频。需要从AI Gallery下载数据至OBS。视频的数据集名字为:交通违规。

首先进入AI Gallery,选择数据,然后搜索dataset-video-9

创建数据集

创建视频数据集,输入路径选择从Gallery下载数据的位置。并添加"person",“car”的标签

开始标注

数据集详情页中,展示了此数据集中 “未标注” 和 “已标注” 的视频。

标注栏与物体检测类似,支持画框、多边形、圆、实线、虚线、点的标注。

在“未标注”页签左侧视频列表中,单击目标视频文件,打开标注页面。

在标注页面中,播放视频,当视频播放至待标注时间时,单击进度条中的暂停按钮,将视频暂停至某一画面。

在左侧区域选择标注框,默认为矩形框。使用鼠标在视频画面中框出目标,然后在弹出的添加标签文本框中,直接输入新的标签名,在文本框前面选中标签颜色,单击“添加”完成1个物体的标注。如果已存在标签,从下拉列表中选择已有的标签,然后单击“添加”完成标注。逐步此画面中所有物体所在位置,一张画面可添加多个标签。

示例1:对交通违规情况所在帧进行标注:斑马线车辆未礼让行人

示例2:无牌车辆闯红灯

上一个暂停画面标注完成后,在进度条处单击播放按钮继续播放,在需要标注的画面中暂停,然后继续标注目标物体。界面右侧将呈现当前视频带标注的时间点。

修改标注

在界面右上角点击标签类别,可显示当前文件标签:

当数据完成标注后,您还可以进入“已标注”页签,删除标注数据。

单击目标编号操作列的,删除该段视频的标注。您也可以单击标注视频文件上方的叉号删除标注,然后单击“确认标注”。

在“已标注”页签下,单击目标视频文件,在标注页面右侧的**“当前文件标签”**下,可单击时间点右侧小三角展开详情,您可以修改或删除标签。

修改标签:单击标签右侧的编辑按钮,标签名称可进行修改。

删除标签:单击标签右侧的删除按钮,将直接删除此标签。如果单击画面时间右侧的删除按钮,将删除此画面下的所有标签。

发布数据集

标注完成后,可以发布版本,会将当前数据集数据存档。

数据集发布后,相关文件的目录结构说明:

由于数据集是基于OBS目录管理的,发布为新版本后,对应的数据集输出位置,也将基于新版本生成目录。

在数据集发布后,其相关文件的目录结构如下。

其manifest文件存放在此目录下:

如何快速准备高质量的视频标注数据?

标注结果文件(XML)为VOC格式,存放在数据集输出目录下:

|-- user-specified-output-path |-- DatasetName-datasetId |-- annotation |-- VersionMame1 |-- VersionMame1.manifest |-- annotations |-- images |-- videoName1 |-- videoName1.timestamp.xml |-- videoName2 |-- videoName2.timestamp.xml |-- VersionMame2 ... |-- ...

视频标注的关键帧存在数据集的输入目录下:

|-- user-specified-input-path |-- images |-- videoName1 |-- videoName1.timestamp.jpg |-- videoName2 |-- videoName2.timestamp.jpg

参考:

【1】华为云ModelArts文档中心:https://support.huaweicloud.com/bestpractice-modelarts/modelarts_10_0018.html

【2】如何快速准备高质量的AI数据? https://bbs.huaweicloud.com/blogs/261979

【3】更多功能:https://bbs.huaweicloud.com/blogs/262413

【4】ModelArts产品地址:https://console.huaweicloud.com/modelarts/?region=cn-north-4#/dataset

AI AI开发平台ModelArts 智能数据 机器学习 视频

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:python的原理你了解多少呢?
下一篇:Python 爬虫之 Requests 库
相关文章