点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - 语料集
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
语料库英文原版新书合集
语料库英文原版新书Atkins:The Oxford Guide to Practical Lexicography.pdf
所属分类:
专业指导
发布日期:2009-05-19
文件大小:3145728
提供者:
wnedu
sogou语料库 迷你版本
sogou 预料库的迷你版本,可用于中文分词的测试,就是一个训练集
所属分类:
Java
发布日期:2009-06-05
文件大小:169984
提供者:
chang84629
武汉大学Rost虚拟学习团队提供的语料库
rost关键词集,包括历史学1万词、图书情报类1万词、心理学类1万词、法律类2万词、新闻传播类9000、计算机类10万词
所属分类:
专业指导
发布日期:2010-04-21
文件大小:685056
提供者:
zhenzixiong
文本文档分类训练语料集
第一列是类别,每一行是一个文本。包括是个类,体育,艺术,计算机,军事等
所属分类:
Java
发布日期:2012-12-11
文件大小:5242880
提供者:
dorarotte
数据挖掘语料库
这是为学习数据挖掘的朋友们做的一个语料库,用此语料库作为训练集训练数据,对数据进行预处理等,帮助大家更好的学习数据挖掘!本语料库所有文档均下载自新浪网站!
所属分类:
Java
发布日期:2013-12-27
文件大小:17825792
提供者:
qiang327
数据集复旦训练
文本分类语料库(复旦)训练语料,中文文本分类算法测试所用。
所属分类:
软件测试
发布日期:2014-08-07
文件大小:52428800
提供者:
solar155
COAE2014评测语料
任务1 篇章级 面向新闻的 情感关键句抽取与判定在给定新闻集合(每篇文章已切成句子)中,判别 每篇文章的情感关键句。 任务2 篇章级 跨语言情感倾向性分析 本任务是对给定多语言篇章级数据集,要求参加系统自动分析多语言篇章级数据集每个情感句的情感倾向性,即(褒义、贬义或者中性)。 任务3 词语级 微博情感新词发现与判定 本任务是对给定大规模的微博句子集,要求参赛系统自动发现新的词语(不在给定的词典以内),以及每个词语的情感倾向性,即褒义、贬义或者中性。 任务4 句子级 微博观点句识别 在给定的微
所属分类:
互联网
发布日期:2016-08-17
文件大小:22020096
提供者:
siyanyu
COAE2014评测语料
任务1 篇章级 面向新闻的 情感关键句抽取与判定在给定新闻集合(每篇文章已切成句子)中,判别 每篇文章的情感关键句。 任务2 篇章级 跨语言情感倾向性分析 本任务是对给定多语言篇章级数据集,要求参加系统自动分析多语言篇章级数据集每个情感句的情感倾向性,即(褒义、贬义或者中性)。 任务3 词语级 微博情感新词发现与判定 本任务是对给定大规模的微博句子集,要求参赛系统自动发现新的词语(不在给定的词典以内),以及每个词语的情感倾向性,即褒义、贬义或者中性。 任务4 句子级 微博观点句识别 在给定的微
所属分类:
其它
发布日期:2016-12-28
文件大小:22020096
提供者:
fsw289040324
复旦中文文本分类语料-训练集
由复旦大学李荣陆提供。answer.rar为测试语料,共9833篇文档;train.rar为训练语料,共9804篇文档,分为20个类别。训练语料和测试语料基本按照1:1的比例来划分。收集工作花费了不少人力和物力,所以请大家在使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。
所属分类:
数据库
发布日期:2017-02-06
文件大小:52428800
提供者:
github_36326955
中文文本分类语料(复旦)-训练集
这个链接是训练集,测试集请见我的资源 本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。
所属分类:
讲义
发布日期:2017-02-06
文件大小:52428800
提供者:
github_36326955
中文文本分类语料(复旦)-训练集
共50.38MB。本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。
所属分类:
讲义
发布日期:2017-03-02
文件大小:52428800
提供者:
wangpei1949
微软亚洲研究院中文分词语料___icwb2-data
微软亚洲研究院中文分词语料_icwb2-data_自然语言处理_科研数据集
所属分类:
机器学习
发布日期:2018-10-11
文件大小:52428800
提供者:
spiritdjy
ccks2018中文问答语料集
该文档为ccks2018(全国语义计算与知识图谱大会)自动问答评测任务的语料集,包含训练集开发集和测试集,该问答评测基于PKUbase知识库。
所属分类:
机器学习
发布日期:2018-10-30
文件大小:152576
提供者:
duters_cmy
NLPCC2014情感分类语料集+已经标注好+中文
NLPCC2014情感分类语料集+已经标注好+中文,主要是够购物相关的评论。
所属分类:
机器学习
发布日期:2018-12-17
文件大小:10485760
提供者:
qq_40989940
电影数据集/语料集
用于自然语言处理的电影语料集。该数据集包含2005-2009期间发布的电影的元数据,财务信息和评论评论,供学术研究使用。这些数据由Mahesh Joshi, Dipanjan Das, Kevin Gimpel和Noah Smith收集 。 如果您撰写任何涉及上述数据使用的论文,请引用本文: 电影评论和收入:文本回归实验 Mahesh Joshi, Dipanjan Das, Kevin Gimpel和 Noah A. Smith 在计算语言学人类语言技术协会北美分会会议录,2010年6月,加
所属分类:
深度学习
发布日期:2019-04-11
文件大小:147849216
提供者:
qq_41219001
NER语料集.zip
整合当前可以找到的NER语料集,并把格式统一化,可以直接训练。
所属分类:
深度学习
发布日期:2019-05-23
文件大小:24117248
提供者:
baidu_24070231
问答机器人语料集清洗完整python代码
问答机器人语料集清洗完整python代码,tensorflow架构,代码说明见博文《问答机器人语料集清洗》 链接:https://blog.csdn.net/u013705518/article/details/95944853
所属分类:
深度学习
发布日期:2019-07-15
文件大小:3072
提供者:
u013705518
复旦大学中文文本分类训练集和测试集.zip
复旦大学中文文本分类训练集和测试集 文件太大压缩为了zip格式。 all文件夹为复旦大学中文文本分类语料集, test_corpus为该语料集中挑选部分划分出来的, train_corpus为该语料集中挑选test_corpus后剩余部分划分出来的。 下载以后可以按照自己的要求指定比例划分训练集和测试集,也可以按照本文档的划分方法。
所属分类:
MySQL
发布日期:2020-01-11
文件大小:105906176
提供者:
zhangvalue
分类语料集
*TanCorp-12:单层语料,12个类别 TanCorp-12词频格式( 财经:0.txt-818.txt; 体育:819.txt-3623.txt; 教育:3624.txt-4431.txt; 卫生:4432.txt-5837.txt; 房产:5838.txt-6772.txt; 科技:6773.txt-7812.txt; 艺术:7813.txt-8358.txt; 娱乐:8359.txt-9858.txt;
所属分类:
专业指导
发布日期:2013-03-13
文件大小:58720256
提供者:
t658229
文本训练语料集.rar
文本训练语料集.rar
所属分类:
机器学习
发布日期:2020-07-25
文件大小:3145728
提供者:
corpse2010
«
1
2
3
4
5
6
7
8
9
10
...
20
»