您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. sklearn文本分类数据包-20newsgroups-20news-bydate

  2. 20newsgroups数据集有三个版本。第一个版本19997是原始的并没有修改过的版本。第二个版本bydate是按时间顺序分为训练(60%)和测试(40%)两部分数据集,不包含交叉文档和新闻组名(新闻组,路径,隶属于,日期)。第三个版本18828不包含交叉文档,只有来源和主题名。
  3. 所属分类:机器学习

    • 发布日期:2017-09-07
    • 文件大小:13631488
    • 提供者:imstudying
  1. 20news-bydate.tar.gz解压后的所有数据汇总

  2. 20newsbydate数据集,主要是用于mahout测试数据,已经将所有的数据汇总到一个zip格式里面了
  3. 所属分类:spark

    • 发布日期:2019-08-28
    • 文件大小:16777216
    • 提供者:souwy
  1. 20newsbydate.zip

  2. 网上非常流行的对文本进行分类和聚类的数据集。 数据集中的数据分为两个部分,一部分用来训练算法模型,一部分用来评估算法的新数据。
  3. 所属分类:互联网

    • 发布日期:2020-06-10
    • 文件大小:22020096
    • 提供者:zaihuan_yu