您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. reuters 21578 语料库解析,将SGML转XML

  2. reuters 21578 语料应用广泛,但由于比较古老,采用了sgml格式,于是我写了点代码把它转化为XML 使用方法(必须有Java运行环境): java -jar r2s2x.jar [reuters21578目录的位置] 运行后结果将输出到当前目录 内含jar及源码 附:reuters21578语料库下载地址: http://www.daviddlewis.com/resources/testcollections/reuters21578/reuters21578.tar.gz
  3. 所属分类:Java

    • 发布日期:2010-08-21
    • 文件大小:14336
    • 提供者:hoszb
  1. Reuters-21578中文说明

  2. Reuters-21578语料库中文说明
  3. 所属分类:其它

    • 发布日期:2012-06-14
    • 文件大小:47104
    • 提供者:killua_hzl
  1. Reuters-21578语料库转成txt脚本(Python)

  2. Reuters-21578语料库转成txt脚本(Python)
  3. 所属分类:Python

    • 发布日期:2012-06-14
    • 文件大小:5120
    • 提供者:killua_hzl
  1. Reuters-21578语料库转成txt脚本(Ruby)

  2. Reuters-21578语料库转成txt脚本(Ruby)
  3. 所属分类:其它

    • 发布日期:2012-06-14
    • 文件大小:3072
    • 提供者:killua_hzl
  1. 提取 Reuter-21578 的程序

  2. 这是一个提取 Reuter-21578 的程序, 用做自然语言处理, 文本分类聚类,和信息检索的测试集!
  3. 所属分类:Python

    • 发布日期:2012-12-03
    • 文件大小:11534336
    • 提供者:cfx337
  1. 路透社语料说明

  2. 对Reuters21578每个文本做出介绍,对reut2-0xx.sgm文本内容做了详细说明,其中的字母代表什么意思,哪些内容代表一个文本,都有说明。
  3. 所属分类:其它

    • 发布日期:2013-11-07
    • 文件大小:47104
    • 提供者:yubin1277408629
  1. Solr可直接执行的Reuters 21578文档集

  2. 原始的Reuters 21578文档集是sgm格式的,不适合直接应用。本文档集中每个新闻为一个文档,包含标题和内容。用Solr可以直接执行。
  3. 所属分类:Web开发

    • 发布日期:2014-12-13
    • 文件大小:12582912
    • 提供者:woshi250hua
  1. reuters-21578

  2. reuters-21578,这是一个英文的语料库,可以用于进行文本的分类与聚类。是文本分类领域共用的一个语料库。
  3. 所属分类:其它

    • 发布日期:2014-12-25
    • 文件大小:7340032
    • 提供者:tuobadon
  1. reuters-21578 转换txt格式Python代码

  2. reuters-21578源文件格式是不能直接拿来用的,这里提供了python代码将文档转换成txt格式
  3. 所属分类:Python

    • 发布日期:2014-12-25
    • 文件大小:5120
    • 提供者:tuobadon
  1. Reuters 21578 MOD Apte

  2. 路透社的数据集,很常用的文本分类数据集,便于大家的使用!可以自己进行构造
  3. 所属分类:专业指导

    • 发布日期:2009-03-12
    • 文件大小:6291456
    • 提供者:qq_22474567
  1. A Comprehensive Survey on Transfer Learning.pdf

  2. Abstract—Transfer learning aims at improving the performance of target learners on target domains by transferring the knowledge contained in different but related source domains. In this way, the dependence on a large number of target domain data ca
  3. 所属分类:深度学习

    • 发布日期:2020-02-29
    • 文件大小:821248
    • 提供者:qq_40712026
  1. CSI4107-香草-搜索-源码

  2. 香草SE8 一个搜索引擎,它可以使用布尔检索模型和向量空间模型来建立索引并执行查询。 它最初是为Reuters-21578语料库设计和实现的,但可以扩展以适应任何语料库。
  3. 所属分类:其它

    • 发布日期:2021-02-18
    • 文件大小:4194304
    • 提供者:weixin_42127835