您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. sogou语料库 迷你版本

  2. sogou 预料库的迷你版本,可用于中文分词的测试,就是一个训练集
  3. 所属分类:Java

    • 发布日期:2009-06-05
    • 文件大小:169984
    • 提供者:chang84629
  1. TempEval-2010中文测试语料。

  2. TempEval-2010第13个任务的中文训练语料。
  3. 所属分类:数据库

    • 发布日期:2011-06-10
    • 文件大小:392192
    • 提供者:wangfenge
  1. crf条件随机场实验

  2. 提供了crf实验用工具crf++ 0.53,支持windows下运行,以及训练用语料,测试用语料,模板,以及实验的基本流程
  3. 所属分类:专业指导

    • 发布日期:2013-11-30
    • 文件大小:2097152
    • 提供者:u012996661
  1. 北大语料库(一月份)

  2. 自然语言处理 ,命名实体识别语料库,分词,测试使用,仅用于研究学习,严禁商业使用
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:8388608
    • 提供者:hj398984059
  1. text8测试文档

  2. 深度学习中word2vector测试语料text8
  3. 所属分类:专业指导

    • 发布日期:2015-05-30
    • 文件大小:30408704
    • 提供者:z3232186
  1. 文本分类语料库

  2. Spark MLlib实现的中文文本分类–Naive Bayes。训练模型,语料非常重要,我这里使用的是搜狗提供的分类语料库,很早之前的了,这里只作为学习测试使用。
  3. 所属分类:其它

    • 发布日期:2016-10-25
    • 文件大小:26214400
    • 提供者:chenjieit619
  1. libsvm分类训练和测试数据语料

  2. 用于libsvm分类的语料,包含训练数据和测试数据,格式为libsvm要求的格式,可用于libsvm工具的练习
  3. 所属分类:其它

    • 发布日期:2016-11-02
    • 文件大小:203776
    • 提供者:mj708955531
  1. 复旦中文文本分类语料-训练集

  2. 由复旦大学李荣陆提供。answer.rar为测试语料,共9833篇文档;train.rar为训练语料,共9804篇文档,分为20个类别。训练语料和测试语料基本按照1:1的比例来划分。收集工作花费了不少人力和物力,所以请大家在使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。
  3. 所属分类:数据库

    • 发布日期:2017-02-06
    • 文件大小:52428800
    • 提供者:github_36326955
  1. 中文文本分类语料(复旦)-训练集

  2. 这个链接是训练集,测试集请见我的资源 本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。
  3. 所属分类:讲义

    • 发布日期:2017-02-06
    • 文件大小:52428800
    • 提供者:github_36326955
  1. 中文文本分类语料(复旦)-训练集

  2. 共50.38MB。本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。
  3. 所属分类:讲义

    • 发布日期:2017-03-02
    • 文件大小:52428800
    • 提供者:wangpei1949
  1. 深度学习中word2vector测试语料text8

  2. 深度学习中word2vector测试语料text8
  3. 所属分类:深度学习

    • 发布日期:2017-08-15
    • 文件大小:30408704
    • 提供者:qq_33394807
  1. 复旦大学语料包括训练集和测试集

  2. 找了很久才找到的,包括训练集和测试集,分享一下。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。
  3. 所属分类:算法与数据结构

    • 发布日期:2018-01-04
    • 文件大小:92274688
    • 提供者:liudanaihuyan
  1. word2vector测试语料text8.rar

  2. word2vector测试语料text8 word2vector测试语料text8 word2vector测试语料text8
  3. 所属分类:机器学习

    • 发布日期:2020-02-10
    • 文件大小:27262976
    • 提供者:WXKY2011
  1. 复旦大学文本分类语料[完整版 训练集+测试集]

  2. answer文件夹为测试语料,共9833篇文档;train文件夹为训练语料,共9804篇文档,分为20个类别。训练语料和测试语料基本按照1:1的比例来划分。收集工作花费了不少人力和物力,所以请大家在使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试集压缩包各50多兆)
  3. 所属分类:机器学习

    • 发布日期:2020-02-10
    • 文件大小:110100480
    • 提供者:wustjk124
  1. 深度学习word2vector测试语料text8

  2. 深度学习中word2vector测试语料text8 word2vec是google的一个开源工具,能够根据输入的词的集合计算出词与词之间的距离。 它将term转换成向量形式,可以把对文本内容的处理简化为向量空间中的向量运算,计算出向量空间上的相似度,来表示文本语义上的相似度。 word2vec计算的是余弦值,距离范围为0-1之间,值越大代表两个词关联度越高。 词向量:用Distributed Representation表示词,通常也被称为“Word Representation”或“W
  3. 所属分类:深度学习

    • 发布日期:2020-02-05
    • 文件大小:27262976
    • 提供者:qq_37489906
  1. 文本分类语料库(复旦)测试语料

  2. 文本分类语料库(复旦)测试语料 由复旦大学李荣陆提供。answer.rar为测试语料,共9833篇文档;train.rar为训练语料,共9804篇文档,分为20个类别。训练语料和测试语料基本按照1:1的比例来划分。收集工作花费了不少人力和物力,所以请大家在使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。 经过数据清理将训练和测试合并成一个csv文件,可以用pandas.read_csv直接读取,分为两列分别是类别和
  3. 所属分类:互联网

    • 发布日期:2020-05-29
    • 文件大小:274726912
    • 提供者:xmrzh
  1. 完整版复旦中文语料库

  2. (完整版)来源:复旦大学计算机信息与技术系国际数据库中心自然语言处理小组;由复旦大学李荣陆提供;test_corpus.rar为测试语料,train_corpus.rar为训练语料。
  3. 所属分类:讲义

    • 发布日期:2020-06-09
    • 文件大小:108003328
    • 提供者:qq_38611819
  1. 复旦大学谭松波中文文本分类语料库.rar

  2. 复旦大学谭松波中文文本分类语料库 中文文本分类语料(复旦大学)-训练集和测试集。测试语料共9833篇文档;训练语料共9804篇文档。
  3. 所属分类:机器学习

    • 发布日期:2020-07-03
    • 文件大小:52428800
    • 提供者:qq_44238741
  1. 复旦中文文本分类语料库.zip

  2. 本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。(使用时尽量注明来源(复旦大学计算机信息与技术系国)
  3. 所属分类:机器学习

    • 发布日期:2020-08-26
    • 文件大小:54525952
    • 提供者:weixin_42691585
  1. 谭松波文文本分类语料(复旦)(无需积分)

  2. 复旦谭松波的,别人辛苦整理,免费发布的东西,拿过来自己赚积分,绝了 数据说明 answer.rar为测试语料,共9833篇文档; train.rar为训练语料,共9804篇文档,分为20个类别。 训练语料和测试语料基本按照1:1的比例来划分。 数据来源 复旦大学计算机信息与技术系国际数据库中心自然语言处理小组 问题描述 适合NLP学习使用
  3. 所属分类:机器学习

    • 发布日期:2020-12-11
    • 文件大小:241172480
    • 提供者:Jasper500
« 12 3 4 5 6 7 8 9 10 »