旷视科技发布全球最大物体检测数据集Objects365 远超COCO、ImageNet

【TechWeb】4月16日，国内AI企业第一梯队的旷视科技在这周发布了全球最大物体检测数据集：Objects365。从数据质量、体量上来看，远远超过现有的ImageNet、COCO数据集，后两者由国外学者、研究人员于几年前发布，在目前的图像识别领域具有较高地位。

目前，图像识别技术依靠海量彩色图像与人工标记的信息进行训练，数据质量直接影响到模型应用效果。微软此前推出的MS-COCO是一个大型的物体检测、图像分割数据集。COCO内包含33万张图像，其中共标记91种物体20多万张图像被标注。而旷视科技发布了通用物体检测数据集Objects365，包含63万张图像，覆盖365个类别数量，边界框高达 1000 万个，相较前者，Objects365的图片数量是COCO的5倍，标注框超过COCO的11倍。

image003

在数据集制作方面，旷视设计出一套科学而严格的标注流程。据悉，Objects365每一张图片的背后至少会经过9名标注工人之手。TechWeb注意到，Objects365目前只有物体检测框（Box），尚无分割（Mask）的部分，猜测这个数据集将主要应用于监控、物体检测。

除发布数据集之外，智源研究院发布“北京智源学者计划”，宣布与旷视共建北京智源-旷视智能模型设计与图像感知联合实验室。另外，还将举办了针对此数据集的CVPR Workshop竞赛。该竞赛共分为三个赛道，其中一条赛道：CrowdHuman，专注于解决现实生活中的人群遮挡问题，其算法的提升将有可能推动人体检测算法商用落地。参赛选手将基于专门为了密集场景人体检测设计的设计的CrowdHuman数据集进行训练。

Objects365现可以在官网下载，有百度云、谷歌云两种下载源，可供AI视觉开发者免费下载，有关CVPR Workshop竞赛的信息也可查询到。