文件名称:
机智:WIT(基于Wikipedia的图像文本)数据集是一个大型的多模式多语言数据集,包含超过1100万种独特的图像以及超过100种语言的37M +种图像-文本对。-源码
开发工具:
文件大小: 1mb
下载次数: 0
上传时间: 2021-03-04
详细说明:WIT:基于维基百科的图像文本数据集
基于维基百科的图像文本(WIT)数据集是一个大型的多模式多语言数据集。 WIT由3,760万个实体丰富的图像文本示例的精选集组成,这些示例文本包含108种Wikipedia语言中的1,150万个唯一图像。 它的大小使WIT可以用作多模式机器学习模型的预训练数据集。
关键优势
WIT的一些独特优势:
按图像文本示例的数量最大的多模式数据集(撰写本文时)。
大规模的多语言(同类中的第一种),涵盖了100多种语言。
各种概念和现实世界实体的集合。
提出具有挑战性的真实世界的测试仪。
您可以从了解有关WIT数据集的更多信息。
WIT示例
维基百科页面
例如,让我们的Wikipedia页面。
Wikipedia页面,其中包含我们可以提取的内容的注释
在此页面上,我们重点介绍了可以提取的各种关键数据-图像,它们各自的文本片段以及一些上下文元数据。
通过
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.