您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 人民日报(北大)语料库

  2. 分词训练语料库,仅供学习和研究使用,禁止用于商业行为
  3. 所属分类:专业指导

    • 发布日期:2009-10-31
    • 文件大小:8388608
    • 提供者:xufengye256
  1. 自然语言处理中聚类技术的训练语料

  2. 提供给自然语言处理研究者聚类工作的训练语料,该语料中包含20个已经划分好的新闻语料。
  3. 所属分类:专业指导

    • 发布日期:2010-05-12
    • 文件大小:16777216
    • 提供者:wenzheng38
  1. TempEval-2010中文训练语料

  2. TempEval-2010第13个任务的中文训练语料。
  3. 所属分类:数据库

    • 发布日期:2011-06-10
    • 文件大小:5242880
    • 提供者:wangfenge
  1. TempEval-2010中文测试语料。

  2. TempEval-2010第13个任务的中文训练语料。
  3. 所属分类:数据库

    • 发布日期:2011-06-10
    • 文件大小:392192
    • 提供者:wangfenge
  1. 训练语料生成器

  2. 用于生成训练语料,供文本分类器使用。在控制台操作,简单易用
  3. 所属分类:Java

    • 发布日期:2013-05-14
    • 文件大小:8192
    • 提供者:u010569416
  1. crf分词标注训练语料

  2. 用与crf分词,标注训练语料。 nlpcc2015任务一的数据
  3. 所属分类:其它

    • 发布日期:2015-09-16
    • 文件大小:10485760
    • 提供者:baidu_26550817
  1. 复旦中文文本分类语料-训练集

  2. 由复旦大学李荣陆提供。answer.rar为测试语料,共9833篇文档;train.rar为训练语料,共9804篇文档,分为20个类别。训练语料和测试语料基本按照1:1的比例来划分。收集工作花费了不少人力和物力,所以请大家在使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。
  3. 所属分类:数据库

    • 发布日期:2017-02-06
    • 文件大小:52428800
    • 提供者:github_36326955
  1. 中文文本分类语料(复旦)-训练集

  2. 这个链接是训练集,测试集请见我的资源 本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。
  3. 所属分类:讲义

    • 发布日期:2017-02-06
    • 文件大小:52428800
    • 提供者:github_36326955
  1. 中文文本分类语料(复旦)-训练集

  2. 共50.38MB。本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。
  3. 所属分类:讲义

    • 发布日期:2017-03-02
    • 文件大小:52428800
    • 提供者:wangpei1949
  1. 中文文本分类语料(复旦)-训练集

  2. 这个链接是训练集,测试集请见我的资源 本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)
  3. 所属分类:其它

    • 发布日期:2017-07-07
    • 文件大小:52428800
    • 提供者:goodluckyue
  1. 复旦已分类文本训练语料

  2. 复旦已分类文本训练语料
  3. 所属分类:算法与数据结构

    • 发布日期:2017-08-01
    • 文件大小:52428800
    • 提供者:u014078192
  1. 复旦大学语料包括训练集和测试集

  2. 找了很久才找到的,包括训练集和测试集,分享一下。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。
  3. 所属分类:算法与数据结构

    • 发布日期:2018-01-04
    • 文件大小:92274688
    • 提供者:liudanaihuyan
  1. 中文文本分类语料训练集

  2. 文本分类语料库(复旦)训练语料。很好很强大,欢迎下载
  3. 所属分类:机器学习

    • 发布日期:2018-04-11
    • 文件大小:54525952
    • 提供者:qq_31186409
  1. msra公开命名实体训练语料

  2. msra公开命名实体训练语料,具体文档见压缩包,可以用于训练命名识别识别
  3. 所属分类:机器学习

    • 发布日期:2018-06-04
    • 文件大小:2097152
    • 提供者:qq_25807909
  1. 英文word2vec模型训练语料

  2. 本语料适合于使用word2vec英文训练的语料,共98M,包括常用的英文词汇,训练后效果不错。
  3. 所属分类:算法与数据结构

    • 发布日期:2018-01-26
    • 文件大小:99614720
    • 提供者:sinat_29694963
  1. JGibbLDA-v.1.0的eclipse工程文件(中文训练语料)

  2. JGibbLDA-v.1.0的eclipse工程文件(中文训练语料)
  3. 所属分类:互联网

    • 发布日期:2019-01-11
    • 文件大小:851968
    • 提供者:qq_22098033
  1. 文本训练语料集.rar

  2. 文本训练语料集.rar
  3. 所属分类:机器学习

    • 发布日期:2020-07-25
    • 文件大小:3145728
    • 提供者:corpse2010
  1. word2vec入门训练语料.txt

  2. word2vec入门训练语料,可以用来跑简单的word embedding训练流程,千里之行始于足下。
  3. 所属分类:互联网

    • 发布日期:2020-10-25
    • 文件大小:62914560
    • 提供者:tybaby1993
  1. MultiWOZ_训练语料 1.1 2.0 2.1 2.2

  2. MultiWOZ_训练语料 1.1 2.0 2.1 2.2
  3. 所属分类:互联网

    • 发布日期:2020-11-03
    • 文件大小:54525952
    • 提供者:wateryh
  1. CLUECorpus2020:适用于中国100G的大规模预训练语料库-源码

  2. CLUECorpus2020:适用于中国100G的大规模预训练语料库
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:123904
    • 提供者:weixin_42134097
« 12 3 4 5 6 7 8 9 10 ... 25 »