搜索资源 - 测试语料 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 测试语料

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

sogou语料库迷你版本
sogou 预料库的迷你版本，可用于中文分词的测试，就是一个训练集
所属分类：Java
- 发布日期：2009-06-05
- 文件大小：169984
- 提供者：chang84629

TempEval-2010中文测试语料。
TempEval-2010第13个任务的中文训练语料。
所属分类：数据库
- 发布日期：2011-06-10
- 文件大小：392192
- 提供者：wangfenge

crf条件随机场实验
提供了crf实验用工具crf++ 0.53，支持windows下运行，以及训练用语料，测试用语料，模板，以及实验的基本流程
所属分类：专业指导
- 发布日期：2013-11-30
- 文件大小：2097152
- 提供者：u012996661

北大语料库（一月份)
自然语言处理，命名实体识别语料库，分词，测试使用，仅用于研究学习，严禁商业使用
所属分类：讲义
- 发布日期：2014-05-29
- 文件大小：8388608
- 提供者：hj398984059

text8测试文档
深度学习中word2vector测试语料text8
所属分类：专业指导
- 发布日期：2015-05-30
- 文件大小：30408704
- 提供者：z3232186

文本分类语料库
Spark MLlib实现的中文文本分类–Naive Bayes。训练模型，语料非常重要，我这里使用的是搜狗提供的分类语料库，很早之前的了，这里只作为学习测试使用。
所属分类：其它
- 发布日期：2016-10-25
- 文件大小：26214400
- 提供者：chenjieit619

libsvm分类训练和测试数据语料
用于libsvm分类的语料，包含训练数据和测试数据，格式为libsvm要求的格式，可用于libsvm工具的练习
所属分类：其它
- 发布日期：2016-11-02
- 文件大小：203776
- 提供者：mj708955531

复旦中文文本分类语料-训练集
由复旦大学李荣陆提供。answer.rar为测试语料，共9833篇文档；train.rar为训练语料，共9804篇文档，分为20个类别。训练语料和测试语料基本按照1:1的比例来划分。收集工作花费了不少人力和物力，所以请大家在使用时尽量注明来源（复旦大学计算机信息与技术系国际数据库中心自然语言处理小组）。文件较大（训练测试各50多兆），下载时请耐心等待。
所属分类：数据库
- 发布日期：2017-02-06
- 文件大小：52428800
- 提供者：github_36326955

中文文本分类语料（复旦）-训练集
这个链接是训练集，测试集请见我的资源本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料，共9833篇文档；train_corpus.rar为训练语料，共9804篇文档，两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源（复旦大学计算机信息与技术系国际数据库中心自然语言处理小组）。文件较大（训练测试各50多兆），下载时请耐心等待。
所属分类：讲义
- 发布日期：2017-02-06
- 文件大小：52428800
- 提供者：github_36326955

中文文本分类语料（复旦）-训练集
共50.38MB。本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料，共9833篇文档；train_corpus.rar为训练语料，共9804篇文档，两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源（复旦大学计算机信息与技术系国际数据库中心自然语言处理小组）。
所属分类：讲义
- 发布日期：2017-03-02
- 文件大小：52428800
- 提供者：wangpei1949

深度学习中word2vector测试语料text8
深度学习中word2vector测试语料text8
所属分类：深度学习
- 发布日期：2017-08-15
- 文件大小：30408704
- 提供者：qq_33394807

复旦大学语料包括训练集和测试集
找了很久才找到的，包括训练集和测试集，分享一下。test_corpus.rar为测试语料，共9833篇文档；train_corpus.rar为训练语料，共9804篇文档，两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源（复旦大学计算机信息与技术系国际数据库中心自然语言处理小组）。文件较大（训练测试各50多兆），下载时请耐心等待。
所属分类：算法与数据结构
- 发布日期：2018-01-04
- 文件大小：92274688
- 提供者：liudanaihuyan

word2vector测试语料text8.rar
word2vector测试语料text8 word2vector测试语料text8 word2vector测试语料text8
所属分类：机器学习
- 发布日期：2020-02-10
- 文件大小：27262976
- 提供者：WXKY2011

复旦大学文本分类语料[完整版训练集+测试集]
answer文件夹为测试语料，共9833篇文档；train文件夹为训练语料，共9804篇文档，分为20个类别。训练语料和测试语料基本按照1:1的比例来划分。收集工作花费了不少人力和物力，所以请大家在使用时尽量注明来源（复旦大学计算机信息与技术系国际数据库中心自然语言处理小组）。文件较大（训练测试集压缩包各50多兆）
所属分类：机器学习
- 发布日期：2020-02-10
- 文件大小：110100480
- 提供者：wustjk124

深度学习word2vector测试语料text8
深度学习中word2vector测试语料text8 word2vec是google的一个开源工具，能够根据输入的词的集合计算出词与词之间的距离。它将term转换成向量形式，可以把对文本内容的处理简化为向量空间中的向量运算，计算出向量空间上的相似度，来表示文本语义上的相似度。 word2vec计算的是余弦值，距离范围为0-1之间，值越大代表两个词关联度越高。词向量：用Distributed Representation表示词，通常也被称为“Word Representation”或“W
所属分类：深度学习
- 发布日期：2020-02-05
- 文件大小：27262976
- 提供者：qq_37489906

文本分类语料库（复旦）测试语料
文本分类语料库（复旦）测试语料由复旦大学李荣陆提供。answer.rar为测试语料，共9833篇文档；train.rar为训练语料，共9804篇文档，分为20个类别。训练语料和测试语料基本按照1:1的比例来划分。收集工作花费了不少人力和物力，所以请大家在使用时尽量注明来源（复旦大学计算机信息与技术系国际数据库中心自然语言处理小组）。文件较大（训练测试各50多兆），下载时请耐心等待。经过数据清理将训练和测试合并成一个csv文件，可以用pandas.read_csv直接读取，分为两列分别是类别和
所属分类：互联网
- 发布日期：2020-05-29
- 文件大小：274726912
- 提供者：xmrzh

完整版复旦中文语料库
（完整版）来源：复旦大学计算机信息与技术系国际数据库中心自然语言处理小组；由复旦大学李荣陆提供；test_corpus.rar为测试语料，train_corpus.rar为训练语料。
所属分类：讲义
- 发布日期：2020-06-09
- 文件大小：108003328
- 提供者：qq_38611819

复旦大学谭松波中文文本分类语料库.rar
复旦大学谭松波中文文本分类语料库中文文本分类语料（复旦大学）-训练集和测试集。测试语料共9833篇文档；训练语料共9804篇文档。
所属分类：机器学习
- 发布日期：2020-07-03
- 文件大小：52428800
- 提供者：qq_44238741

复旦中文文本分类语料库.zip
本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料，共9833篇文档；train_corpus.rar为训练语料，共9804篇文档，两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。（使用时尽量注明来源（复旦大学计算机信息与技术系国）
所属分类：机器学习
- 发布日期：2020-08-26
- 文件大小：54525952
- 提供者：weixin_42691585

谭松波文文本分类语料（复旦）（无需积分）
复旦谭松波的，别人辛苦整理，免费发布的东西，拿过来自己赚积分，绝了数据说明 answer.rar为测试语料，共9833篇文档； train.rar为训练语料，共9804篇文档，分为20个类别。训练语料和测试语料基本按照1:1的比例来划分。数据来源复旦大学计算机信息与技术系国际数据库中心自然语言处理小组问题描述适合NLP学习使用
所属分类：机器学习
- 发布日期：2020-12-11
- 文件大小：241172480
- 提供者：Jasper500

« 12 3 4 5 6 7 8 9 10 »