【TechWeb】4月16日,国内AI企业第一梯队的旷视科技在这周发布了全球最大物体检测数据集:Objects365。从数据质量、体量上来看,远远超过现有的ImageNet、COCO数据集,后两者由国外学者、研究人员于几年前发布,在目前的图像识别领域具有较高地位。

image001

目前,图像识别技术依靠海量彩色图像与人工标记的信息进行训练,数据质量直接影响到模型应用效果。微软此前推出的MS-COCO是一个大型的物体检测、图像分割数据集。COCO内包含33万张图像,其中共标记91种物体20多万张图像被标注。而旷视科技发布了通用物体检测数据集Objects365,包含63万张图像,覆盖365个类别数量,边界框高达 1000 万个,相较前者,Objects365的图片数量是COCO的5倍,标注框超过COCO的11倍。

image003

image003

在数据集制作方面,旷视设计出一套科学而严格的标注流程。据悉,Objects365每一张图片的背后至少会经过9名标注工人之手。TechWeb注意到,Objects365目前只有物体检测框(Box),尚无分割(Mask)的部分,猜测这个数据集将主要应用于监控、物体检测。

除发布数据集之外,智源研究院发布“北京智源学者计划”,宣布与旷视共建北京智源-旷视智能模型设计与图像感知联合实验室。另外,还将举办了针对此数据集的CVPR Workshop竞赛。该竞赛共分为三个赛道,其中一条赛道:CrowdHuman,专注于解决现实生活中的人群遮挡问题,其算法的提升将有可能推动人体检测算法商用落地。参赛选手将基于专门为了密集场景人体检测设计的设计的CrowdHuman数据集进行训练。

Objects365现可以在官网下载,有百度云、谷歌云两种下载源,可供AI视觉开发者免费下载,有关CVPR Workshop竞赛的信息也可查询到。

相关文章