您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 文本分类聚类数据集sqlserver2008格式

  2. 包含四个数据集,分别从english20newsgroup、reuters 中提取,分别为500条记录,各含五类,每类文档数目不同!从两个母数据库中提取,存储为sqlserver2008格式,可以直接附加,表结构如下!全部进行了标注,可以用来分类或者聚类!
  3. 所属分类:SQLServer

    • 发布日期:2011-09-16
    • 文件大小:4194304
    • 提供者:miracletiger
  1. 20news数据集

  2. 20news-bydate.tar.gz 文本分类 数据集 20news
  3. 所属分类:IT管理

    • 发布日期:2011-10-27
    • 文件大小:13631488
    • 提供者:hanlanshenlan
  1. sraa数据集

  2. sraa文本分类 数据集sraa文本分类 数据集 sraa文本分类 数据集
  3. 所属分类:网络管理

    • 发布日期:2011-10-27
    • 文件大小:44040192
    • 提供者:hanlanshenlan
  1. 搜狗文本挖掘数据集迷你版

  2. 搜狗文本挖掘数据集迷你版,有以下几个类别,各几个文件。 C000007 汽车 C000008 财经 C000010 IT C000013 健康 C000014 体育 C000016 旅游 C000020 教育 C000022 招聘 C000023 文化 C000024 军事
  3. 所属分类:其它

    • 发布日期:2011-12-28
    • 文件大小:169984
    • 提供者:daimin02love
  1. 文本挖掘所需的批量文本

  2. 数据挖掘中的文本挖掘所需的批量文本,其中含有10个类别的(含有计算机、环境、政治、体育、经济、军事等),近3000个文件,对于学习文本挖掘提供了一个较好的数据集。
  3. 所属分类:数据库

    • 发布日期:2012-11-19
    • 文件大小:3145728
    • 提供者:baifuhan
  1. 数据集复旦测试

  2. 复旦大学提供文本分类测试数据集,用于测试文本分类挖掘算法。
  3. 所属分类:软件测试

    • 发布日期:2014-08-07
    • 文件大小:53477376
    • 提供者:solar155
  1. 情感分析数据集(正面10000条,负面5000条)

  2. 吸收了 谭松波 非平衡酒店评论语料库(7000条正面,3000条负面,有部分重复数据),加上我从携程上抓取的数据,经过繁简转换、去重、去掉4字以下过短评论,形成最终的评论数据集(10000条正面,5000条负面,文本中每行为一个评论),欢迎下载使用!ps.数据正负面归类是按照携程上“值得推介”和“有待改善”栏目做初步区分,然后再经过人工筛选剔除归类错误的数据形成,因此难免会有错误,欢迎修正!358473546@qq.com
  3. 所属分类:机器学习

    • 发布日期:2017-07-17
    • 文件大小:1048576
    • 提供者:u010097581
  1. PTB文本数据集

  2. PTB(Penn Treebank Dataset)文本数据集是语言模型学习中目前最广泛使用的数据集。PTB(Penn Treebank Dataset)文本数据集是语言模型学习中目前最广泛使用的数据集。
  3. 所属分类:机器学习

    • 发布日期:2017-09-21
    • 文件大小:34603008
    • 提供者:tz_zs
  1. 标签专题图转文本数据集

  2. 把标签专题图的标签转换成文本数据集,该资源由超图技术资源中心提供。
  3. 所属分类:C#

    • 发布日期:2017-12-13
    • 文件大小:10485760
    • 提供者:supermapsupport
  1. SuperMap Objects .NET字段转为文本数据集

  2. 示例在SuperMap Objects.NET 6R中实现将数据集的属性字段生成一个文本数据集。
  3. 所属分类:C#

    • 发布日期:2017-12-14
    • 文件大小:6291456
    • 提供者:supermapsupport
  1. SuperMap Objects .NET文本数据集相关属性入表

  2. 将文本数据集中文本、位置等属性录入文本数据集属性表中,方便属性信息的导出。
  3. 所属分类:C#

    • 发布日期:2017-12-15
    • 文件大小:141312
    • 提供者:s201301110109
  1. 训练Adaboost人脸检测器数据集及自动获取文件名程序

  2. 使用opencv3.1中自带训练引擎,人脸识别数据集,里面包含一个自动获取文件名字并生成对应文本的C++程序
  3. 所属分类:机器学习

    • 发布日期:2018-03-20
    • 文件大小:7340032
    • 提供者:sinat_31425585
  1. 超实惠-复旦大学文本分类数据集(训练集+测试集)

  2. 网上很多复旦大学的文本分类数据集,但是训练和测试大多是分开的。 我收集下载重新打包,以方便大家使用。 仅需5个积分,是最便宜的了。
  3. 所属分类:机器学习

    • 发布日期:2018-04-10
    • 文件大小:108003328
    • 提供者:lingpy
  1. 复旦文本分类语料数据集 包含训练集和测试集和全集

  2. 复旦中文文本分类数据集,包含训练集和测试集,自然语言处理 看论文看到数据堂的复旦中文文本分类语料无法下载,网上找到了训练集和测试集,4积分,良心价
  3. 所属分类:机器学习

    • 发布日期:2018-07-12
    • 文件大小:110100480
    • 提供者:zhangzc12409
  1. 斯坦福问答数据集

  2. 该数据集包含一系列文本和基于文本的问题、答案。针对该数据集提出的任务要求系统阅读文本后判断该问题是否可以从文本中得出答案,如果可以回答则从文本中截取某一片段做出回答。
  3. 所属分类:深度学习

    • 发布日期:2018-09-26
    • 文件大小:9437184
    • 提供者:zz_lian
  1. PTB文本数据集

  2. PTB(Penn Treebank Dataset)文本数据集是语言模型学习中目前最广泛使用的数据集。
  3. 所属分类:深度学习

    • 发布日期:2019-03-31
    • 文件大小:34603008
    • 提供者:xiaosongshine
  1. ToTTo:an open-domain English table-to-text dataset开源英文表格到文本数据集ToTTo-数据集

  2. ToTTo is provided by Google Research.本数据集由谷歌研究工作室提供。 totto_datasets.zip
  3. 所属分类:其它

    • 发布日期:2021-03-12
    • 文件大小:187695104
    • 提供者:weixin_38672940
  1. 机智:WIT(基于Wikipedia的图像文本)数据集是一个大型的多模式多语言数据集,包含超过1100万种独特的图像以及超过100种语言的37M +种图像-文本对。-源码

  2. WIT:基于维基百科的图像文本数据集 基于维基百科的图像文本(WIT)数据集是一个大型的多模式多语言数据集。 WIT由3,760万个实体丰富的图像文本示例的精选集组成,这些示例文本包含108种Wikipedia语言中的1,150万个唯一图像。 它的大小使WIT可以用作多模式机器学习模型的预训练数据集。 关键优势 WIT的一些独特优势: 按图像文本示例的数量最大的多模式数据集(撰写本文时)。 大规模的多语言(同类中的第一种),涵盖了100多种语言。 各种概念和现实世界实体的集合。 提出具有
  3. 所属分类:其它

    • 发布日期:2021-03-04
    • 文件大小:1048576
    • 提供者:weixin_42105570
  1. textgenrnn:只需几行代码,即可在任何文本数据集上轻松训练您自己的任意大小和复杂度的文本生成神经网络-源码

  2. 文本生成 只需几行代码,即可在任何文本数据集上轻松训练您自己的任意大小和复杂度的文本生成神经网络,或者使用预先训练的模型快速训练文本。 textgenrnn是上的顶部一个Python 3模块 / 用于创建 S,与许多凉爽特性: 一种现代的神经网络体系结构,利用诸如注意力加权和跳过嵌入的新技术来加快训练速度并提高模型质量。 训练并在字符级别或单词级别生成文本。 配置RNN大小,RNN层数以及是否使用双向RNN。 训练任何通用输入文本文件,包括大文件。 在GPU上训练模型,然后使用它们
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:9437184
    • 提供者:weixin_42099176
  1. 数据集:with具有快速,易于使用和高效的数据处理工具的ML模型最大的即用型NLP数据集中心-源码

  2. :hugging_face:Datasets是一个轻量级的库,提供两个主要功能: 一线数据加载器,可用于许多公共数据集:一线可下载和预处理任何 上提供的主要公共数据集(使用467种语言和方言!)。 使用像squad_dataset = load_datasets("squad")这样的简单命令,即可将这些数据集中的任何一个准备好在数据加载器中用于训练/评估ML模型(Numpy / Pandas / PyTorch / TensorFlow / JAX), 高效的数据预处理:对上述公共数据集以
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:28311552
    • 提供者:weixin_42131424
« 12 3 4 5 6 7 8 9 10 ... 50 »