您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 复旦大学中文文本分类数据集

  2. 本语料库由复旦大学李荣陆提供。 train.zip共9804篇文档,test.zip共9832篇文档,都分为20个类别。 下载后可以自己重新切分数据,也可以直接用。 免费下载地址:链接:https://pan.baidu.com/s/1E2vUjyBtrlG0SBCkO-_IAQ 密码:dq9m 使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。
  3. 所属分类:机器学习

    • 发布日期:2019-07-17
    • 文件大小:111149056
    • 提供者:number59
  1. 复旦大学中文文本分类数据集utf8格式

  2. 本语料库由复旦大学李荣陆提供。 下载的原始数据编码格式是gb18030,用python解析时报错,这个是用java将数据格式转为utf-8编码格式后的结果。 train.zip共9804篇文档,test.zip共9832篇文档,都分为20个类别。 下载后可以自己重新切分数据,也可以直接用。 免费下载地址:链接:https://pan.baidu.com/s/1m0stk-0AovdbMNT5-CMdSA 密码:2bvz 使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小
  3. 所属分类:机器学习

    • 发布日期:2019-07-19
    • 文件大小:125829120
    • 提供者:number59
  1. 复旦中文文本分类语料库.zip

  2. 本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。(使用时尽量注明来源(复旦大学计算机信息与技术系国)
  3. 所属分类:机器学习

    • 发布日期:2020-08-26
    • 文件大小:54525952
    • 提供者:weixin_42691585