您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 语料库英文原版新书合集

  2. 语料库英文原版新书Atkins:The Oxford Guide to Practical Lexicography.pdf
  3. 所属分类:专业指导

    • 发布日期:2009-05-19
    • 文件大小:3145728
    • 提供者:wnedu
  1. sogou语料库 迷你版本

  2. sogou 预料库的迷你版本,可用于中文分词的测试,就是一个训练集
  3. 所属分类:Java

    • 发布日期:2009-06-05
    • 文件大小:169984
    • 提供者:chang84629
  1. 武汉大学Rost虚拟学习团队提供的语料库

  2. rost关键词集,包括历史学1万词、图书情报类1万词、心理学类1万词、法律类2万词、新闻传播类9000、计算机类10万词
  3. 所属分类:专业指导

    • 发布日期:2010-04-21
    • 文件大小:685056
    • 提供者:zhenzixiong
  1. 文本文档分类训练语料集

  2. 第一列是类别,每一行是一个文本。包括是个类,体育,艺术,计算机,军事等
  3. 所属分类:Java

    • 发布日期:2012-12-11
    • 文件大小:5242880
    • 提供者:dorarotte
  1. 数据挖掘语料库

  2. 这是为学习数据挖掘的朋友们做的一个语料库,用此语料库作为训练集训练数据,对数据进行预处理等,帮助大家更好的学习数据挖掘!本语料库所有文档均下载自新浪网站!
  3. 所属分类:Java

    • 发布日期:2013-12-27
    • 文件大小:17825792
    • 提供者:qiang327
  1. 数据集复旦训练

  2. 文本分类语料库(复旦)训练语料,中文文本分类算法测试所用。
  3. 所属分类:软件测试

    • 发布日期:2014-08-07
    • 文件大小:52428800
    • 提供者:solar155
  1. COAE2014评测语料

  2. 任务1 篇章级 面向新闻的 情感关键句抽取与判定在给定新闻集合(每篇文章已切成句子)中,判别 每篇文章的情感关键句。 任务2 篇章级 跨语言情感倾向性分析 本任务是对给定多语言篇章级数据集,要求参加系统自动分析多语言篇章级数据集每个情感句的情感倾向性,即(褒义、贬义或者中性)。 任务3 词语级 微博情感新词发现与判定 本任务是对给定大规模的微博句子集,要求参赛系统自动发现新的词语(不在给定的词典以内),以及每个词语的情感倾向性,即褒义、贬义或者中性。 任务4 句子级 微博观点句识别 在给定的微
  3. 所属分类:互联网

    • 发布日期:2016-08-17
    • 文件大小:22020096
    • 提供者:siyanyu
  1. COAE2014评测语料

  2. 任务1 篇章级 面向新闻的 情感关键句抽取与判定在给定新闻集合(每篇文章已切成句子)中,判别 每篇文章的情感关键句。 任务2 篇章级 跨语言情感倾向性分析 本任务是对给定多语言篇章级数据集,要求参加系统自动分析多语言篇章级数据集每个情感句的情感倾向性,即(褒义、贬义或者中性)。 任务3 词语级 微博情感新词发现与判定 本任务是对给定大规模的微博句子集,要求参赛系统自动发现新的词语(不在给定的词典以内),以及每个词语的情感倾向性,即褒义、贬义或者中性。 任务4 句子级 微博观点句识别 在给定的微
  3. 所属分类:其它

    • 发布日期:2016-12-28
    • 文件大小:22020096
    • 提供者:fsw289040324
  1. 复旦中文文本分类语料-训练集

  2. 由复旦大学李荣陆提供。answer.rar为测试语料,共9833篇文档;train.rar为训练语料,共9804篇文档,分为20个类别。训练语料和测试语料基本按照1:1的比例来划分。收集工作花费了不少人力和物力,所以请大家在使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。
  3. 所属分类:数据库

    • 发布日期:2017-02-06
    • 文件大小:52428800
    • 提供者:github_36326955
  1. 中文文本分类语料(复旦)-训练集

  2. 这个链接是训练集,测试集请见我的资源 本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。
  3. 所属分类:讲义

    • 发布日期:2017-02-06
    • 文件大小:52428800
    • 提供者:github_36326955
  1. 中文文本分类语料(复旦)-训练集

  2. 共50.38MB。本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。
  3. 所属分类:讲义

    • 发布日期:2017-03-02
    • 文件大小:52428800
    • 提供者:wangpei1949
  1. 微软亚洲研究院中文分词语料___icwb2-data

  2. 微软亚洲研究院中文分词语料_icwb2-data_自然语言处理_科研数据集
  3. 所属分类:机器学习

    • 发布日期:2018-10-11
    • 文件大小:52428800
    • 提供者:spiritdjy
  1. ccks2018中文问答语料集

  2. 该文档为ccks2018(全国语义计算与知识图谱大会)自动问答评测任务的语料集,包含训练集开发集和测试集,该问答评测基于PKUbase知识库。
  3. 所属分类:机器学习

    • 发布日期:2018-10-30
    • 文件大小:152576
    • 提供者:duters_cmy
  1. NLPCC2014情感分类语料集+已经标注好+中文

  2. NLPCC2014情感分类语料集+已经标注好+中文,主要是够购物相关的评论。
  3. 所属分类:机器学习

    • 发布日期:2018-12-17
    • 文件大小:10485760
    • 提供者:qq_40989940
  1. 电影数据集/语料集

  2. 用于自然语言处理的电影语料集。该数据集包含2005-2009期间发布的电影的元数据,财务信息和评论评论,供学术研究使用。这些数据由Mahesh Joshi, Dipanjan Das, Kevin Gimpel和Noah Smith收集 。 如果您撰写任何涉及上述数据使用的论文,请引用本文: 电影评论和收入:文本回归实验 Mahesh Joshi, Dipanjan Das, Kevin Gimpel和 Noah A. Smith 在计算语言学人类语言技术协会北美分会会议录,2010年6月,加
  3. 所属分类:深度学习

    • 发布日期:2019-04-11
    • 文件大小:147849216
    • 提供者:qq_41219001
  1. NER语料集.zip

  2. 整合当前可以找到的NER语料集,并把格式统一化,可以直接训练。
  3. 所属分类:深度学习

    • 发布日期:2019-05-23
    • 文件大小:24117248
    • 提供者:baidu_24070231
  1. 问答机器人语料集清洗完整python代码

  2. 问答机器人语料集清洗完整python代码,tensorflow架构,代码说明见博文《问答机器人语料集清洗》 链接:https://blog.csdn.net/u013705518/article/details/95944853
  3. 所属分类:深度学习

    • 发布日期:2019-07-15
    • 文件大小:3072
    • 提供者:u013705518
  1. 复旦大学中文文本分类训练集和测试集.zip

  2. 复旦大学中文文本分类训练集和测试集 文件太大压缩为了zip格式。 all文件夹为复旦大学中文文本分类语料集, test_corpus为该语料集中挑选部分划分出来的, train_corpus为该语料集中挑选test_corpus后剩余部分划分出来的。 下载以后可以按照自己的要求指定比例划分训练集和测试集,也可以按照本文档的划分方法。
  3. 所属分类:MySQL

    • 发布日期:2020-01-11
    • 文件大小:105906176
    • 提供者:zhangvalue
  1. 分类语料集

  2. *TanCorp-12:单层语料,12个类别 TanCorp-12词频格式( 财经:0.txt-818.txt; 体育:819.txt-3623.txt; 教育:3624.txt-4431.txt; 卫生:4432.txt-5837.txt; 房产:5838.txt-6772.txt; 科技:6773.txt-7812.txt; 艺术:7813.txt-8358.txt; 娱乐:8359.txt-9858.txt;
  3. 所属分类:专业指导

    • 发布日期:2013-03-13
    • 文件大小:58720256
    • 提供者:t658229
  1. 文本训练语料集.rar

  2. 文本训练语料集.rar
  3. 所属分类:机器学习

    • 发布日期:2020-07-25
    • 文件大小:3145728
    • 提供者:corpse2010
« 12 3 4 5 6 7 8 9 10 ... 20 »