点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - 文本数据集
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
文本分类聚类数据集sqlserver2008格式
包含四个数据集,分别从english20newsgroup、reuters 中提取,分别为500条记录,各含五类,每类文档数目不同!从两个母数据库中提取,存储为sqlserver2008格式,可以直接附加,表结构如下!全部进行了标注,可以用来分类或者聚类!
所属分类:
SQLServer
发布日期:2011-09-16
文件大小:4194304
提供者:
miracletiger
20news数据集
20news-bydate.tar.gz 文本分类 数据集 20news
所属分类:
IT管理
发布日期:2011-10-27
文件大小:13631488
提供者:
hanlanshenlan
sraa数据集
sraa文本分类 数据集sraa文本分类 数据集 sraa文本分类 数据集
所属分类:
网络管理
发布日期:2011-10-27
文件大小:44040192
提供者:
hanlanshenlan
搜狗文本挖掘数据集迷你版
搜狗文本挖掘数据集迷你版,有以下几个类别,各几个文件。 C000007 汽车 C000008 财经 C000010 IT C000013 健康 C000014 体育 C000016 旅游 C000020 教育 C000022 招聘 C000023 文化 C000024 军事
所属分类:
其它
发布日期:2011-12-28
文件大小:169984
提供者:
daimin02love
文本挖掘所需的批量文本
数据挖掘中的文本挖掘所需的批量文本,其中含有10个类别的(含有计算机、环境、政治、体育、经济、军事等),近3000个文件,对于学习文本挖掘提供了一个较好的数据集。
所属分类:
数据库
发布日期:2012-11-19
文件大小:3145728
提供者:
baifuhan
数据集复旦测试
复旦大学提供文本分类测试数据集,用于测试文本分类挖掘算法。
所属分类:
软件测试
发布日期:2014-08-07
文件大小:53477376
提供者:
solar155
情感分析数据集(正面10000条,负面5000条)
吸收了 谭松波 非平衡酒店评论语料库(7000条正面,3000条负面,有部分重复数据),加上我从携程上抓取的数据,经过繁简转换、去重、去掉4字以下过短评论,形成最终的评论数据集(10000条正面,5000条负面,文本中每行为一个评论),欢迎下载使用!ps.数据正负面归类是按照携程上“值得推介”和“有待改善”栏目做初步区分,然后再经过人工筛选剔除归类错误的数据形成,因此难免会有错误,欢迎修正!358473546@qq.com
所属分类:
机器学习
发布日期:2017-07-17
文件大小:1048576
提供者:
u010097581
PTB文本数据集
PTB(Penn Treebank Dataset)文本数据集是语言模型学习中目前最广泛使用的数据集。PTB(Penn Treebank Dataset)文本数据集是语言模型学习中目前最广泛使用的数据集。
所属分类:
机器学习
发布日期:2017-09-21
文件大小:34603008
提供者:
tz_zs
标签专题图转文本数据集
把标签专题图的标签转换成文本数据集,该资源由超图技术资源中心提供。
所属分类:
C#
发布日期:2017-12-13
文件大小:10485760
提供者:
supermapsupport
SuperMap Objects .NET字段转为文本数据集
示例在SuperMap Objects.NET 6R中实现将数据集的属性字段生成一个文本数据集。
所属分类:
C#
发布日期:2017-12-14
文件大小:6291456
提供者:
supermapsupport
SuperMap Objects .NET文本数据集相关属性入表
将文本数据集中文本、位置等属性录入文本数据集属性表中,方便属性信息的导出。
所属分类:
C#
发布日期:2017-12-15
文件大小:141312
提供者:
s201301110109
训练Adaboost人脸检测器数据集及自动获取文件名程序
使用opencv3.1中自带训练引擎,人脸识别数据集,里面包含一个自动获取文件名字并生成对应文本的C++程序
所属分类:
机器学习
发布日期:2018-03-20
文件大小:7340032
提供者:
sinat_31425585
超实惠-复旦大学文本分类数据集(训练集+测试集)
网上很多复旦大学的文本分类数据集,但是训练和测试大多是分开的。 我收集下载重新打包,以方便大家使用。 仅需5个积分,是最便宜的了。
所属分类:
机器学习
发布日期:2018-04-10
文件大小:108003328
提供者:
lingpy
复旦文本分类语料数据集 包含训练集和测试集和全集
复旦中文文本分类数据集,包含训练集和测试集,自然语言处理 看论文看到数据堂的复旦中文文本分类语料无法下载,网上找到了训练集和测试集,4积分,良心价
所属分类:
机器学习
发布日期:2018-07-12
文件大小:110100480
提供者:
zhangzc12409
斯坦福问答数据集
该数据集包含一系列文本和基于文本的问题、答案。针对该数据集提出的任务要求系统阅读文本后判断该问题是否可以从文本中得出答案,如果可以回答则从文本中截取某一片段做出回答。
所属分类:
深度学习
发布日期:2018-09-26
文件大小:9437184
提供者:
zz_lian
PTB文本数据集
PTB(Penn Treebank Dataset)文本数据集是语言模型学习中目前最广泛使用的数据集。
所属分类:
深度学习
发布日期:2019-03-31
文件大小:34603008
提供者:
xiaosongshine
ToTTo:an open-domain English table-to-text dataset开源英文表格到文本数据集ToTTo-数据集
ToTTo is provided by Google Research.本数据集由谷歌研究工作室提供。 totto_datasets.zip
所属分类:
其它
发布日期:2021-03-12
文件大小:187695104
提供者:
weixin_38672940
机智:WIT(基于Wikipedia的图像文本)数据集是一个大型的多模式多语言数据集,包含超过1100万种独特的图像以及超过100种语言的37M +种图像-文本对。-源码
WIT:基于维基百科的图像文本数据集 基于维基百科的图像文本(WIT)数据集是一个大型的多模式多语言数据集。 WIT由3,760万个实体丰富的图像文本示例的精选集组成,这些示例文本包含108种Wikipedia语言中的1,150万个唯一图像。 它的大小使WIT可以用作多模式机器学习模型的预训练数据集。 关键优势 WIT的一些独特优势: 按图像文本示例的数量最大的多模式数据集(撰写本文时)。 大规模的多语言(同类中的第一种),涵盖了100多种语言。 各种概念和现实世界实体的集合。 提出具有
所属分类:
其它
发布日期:2021-03-04
文件大小:1048576
提供者:
weixin_42105570
textgenrnn:只需几行代码,即可在任何文本数据集上轻松训练您自己的任意大小和复杂度的文本生成神经网络-源码
文本生成 只需几行代码,即可在任何文本数据集上轻松训练您自己的任意大小和复杂度的文本生成神经网络,或者使用预先训练的模型快速训练文本。 textgenrnn是上的顶部一个Python 3模块 / 用于创建 S,与许多凉爽特性: 一种现代的神经网络体系结构,利用诸如注意力加权和跳过嵌入的新技术来加快训练速度并提高模型质量。 训练并在字符级别或单词级别生成文本。 配置RNN大小,RNN层数以及是否使用双向RNN。 训练任何通用输入文本文件,包括大文件。 在GPU上训练模型,然后使用它们
所属分类:
其它
发布日期:2021-02-04
文件大小:9437184
提供者:
weixin_42099176
数据集:with具有快速,易于使用和高效的数据处理工具的ML模型最大的即用型NLP数据集中心-源码
:hugging_face:Datasets是一个轻量级的库,提供两个主要功能: 一线数据加载器,可用于许多公共数据集:一线可下载和预处理任何 上提供的主要公共数据集(使用467种语言和方言!)。 使用像squad_dataset = load_datasets("squad")这样的简单命令,即可将这些数据集中的任何一个准备好在数据加载器中用于训练/评估ML模型(Numpy / Pandas / PyTorch / TensorFlow / JAX), 高效的数据预处理:对上述公共数据集以
所属分类:
其它
发布日期:2021-02-03
文件大小:28311552
提供者:
weixin_42131424
«
1
2
3
4
5
6
7
8
9
10
...
50
»