《深度学习之图像识别:核心技术与案例实战》 ——3.1.4 ImageNet数据集

网友投稿 1032 2022-05-29

3.1.4  ImageNet数据集

ImageNet数据集地址为:http://www.image-net.org/,2009年由李飞飞实验室发布。

ImageNet数据集是李飞飞实验室主导的一个项目,目标是构建一个计算机视觉研究的大型数据库,关键词从WordNet中选取。完整的ImageNet数据集有1400多万幅图片,涵盖2万多个类别的标注与超过百万的边界框标注,每一个类别大约有500~1000张图片,标注采用了亚马逊的众包平台,这个平台之后被用于构建各种数据集。

2009年CVPR会议室李飞飞实验室正式发布了ImageNet数据集,此后从2010年到2017年共举办了8届Large Scale Visual Recognition Challenge,即业界熟知的ILSVRC比赛,包括图像分类、目标检测和目标定位单元。

在最开始的时候,ImageNet是一个连经费都申请不到的整理数据的项目,为很多专注于算法研究的学术人员“不耻”,但科技公司的竞赛热情及数据集史无前例的多样性,让陷身于过拟合的算法从数据集本身看到了新的出路,之后极大地推进了计算机视觉任务的发展。

由于类别多,ImageNet不可能像MNIST数据集整理过程中那样简单地将所有图片分成互不相干的10类,而是采用了WordNet中树形结构的组织方式。比如从哺乳动物关键词开始整理,然后不断细分为有胎盘的哺乳动物→肉食动物→犬科动物→狗→工作中的狗→哈士奇。

《深度学习之图像识别:核心技术与案例实战》 ——3.1.4 ImageNet数据集

ImageNet竞赛使用的是ImageNet完整数据集的一个子类,包括1000类,其中大部分是动物。在深度学习任务中,我们经常会使用ImageNet预训练的模型,不过大部分人未必了解ImageNet数据集的构建过程和历史,有兴趣的读者可以去查阅详细了解。

图像识别 图像识别服务 Image 图像识别服务

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:android7.0更新安装apk的方法
下一篇:#化鲲为鹏,我有话说# + 鲲鹏ARM服务器芯片主要存在以下挑战
相关文章