MS COCO的全称是Microsoft Common Objects in Context,起源于微软于2014年出资标注的Microsoft COCO数据集,与ImageNet竞赛一样,被视为是计算机视觉领域最受关注和最权威的比赛之一。
COCO数据集是一个大型的、丰富的物体检测,分割和字幕数据集。这个数据集以scene understanding为目标,主要从复杂的日常场景中截取,图像中的目标通过精确的segmentation进行位置的标定。图像包括91类目标,328,0
udt-dataset-coco
COCO数据集,转换为UDT格式(CSV和JSON)
这些文件可以导入到通用数据工具中。
API
您可以使用API查询与字幕匹配的图像。 该API将返回有效的UDT数据集。
获取所有与标签匹配的图像
GET /api/captions?labels=cat,dog
独家获取所有与标签匹配的图像
例如猫或狗的图像,但没有包含猫和狗的图像。
GET /api/captions?labels=cat,dog&exclusive
获取不同细分的所有图像