您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 搜狗新闻语料库转存数据库java程序

  2. 整理搜狗2008版搜狗新闻分类语料库和全网新闻分类语料库--转存至mysql数据库
  3. 所属分类:Java

    • 发布日期:2011-06-08
    • 文件大小:22528
    • 提供者:raindreams
  1. 网易新闻语料库 文本分类 自然语言处理

  2. 网易新闻语料库 文本分类 自然语言处理 网上基本找不到哦~~
  3. 所属分类:其它

    • 发布日期:2013-12-11
    • 文件大小:38797312
    • 提供者:llwszjj
  1. 新闻分类语料

  2. 新闻分类语料,9个类别财经,教育,军事,科技,政治等 按新闻标签爬取的。
  3. 所属分类:其它

    • 发布日期:2015-09-16
    • 文件大小:18874368
    • 提供者:baidu_26550817
  1. 新闻语料库

  2. 包含2015年一整年的新闻,文件以txt形式存储,是从各大网站上爬取下来的。希望喜欢
  3. 所属分类:Java

    • 发布日期:2016-09-11
    • 文件大小:18874368
    • 提供者:u013006982
  1. 文本分类语料库

  2. 所属分类:Java

    • 发布日期:2016-12-16
    • 文件大小:30408704
    • 提供者:zht0627
  1. 搜狐新闻分类语料库

  2. 搜狐新闻分类语料库,主要包含 0 汽车 1 财经 2 IT 3 健康 4 体育 5 旅游 6 教育 7 招聘 8 文化 9 军事 十个分类,共50多万条记录
  3. 所属分类:机器学习

    • 发布日期:2017-06-19
    • 文件大小:68157440
    • 提供者:whzhaochao
  1. 搜狗实验室新闻分类语料库

  2. 搜狗实验室新闻分类语料库,主要有10个分类,共50多万条记录 0 汽车 1 财经 2 IT 3 健康 4 体育 5 旅游 6 教育 7 招聘 8 文化 9 军事
  3. 所属分类:机器学习

    • 发布日期:2017-06-19
    • 文件大小:26214400
    • 提供者:whzhaochao
  1. 基于事件卷积特征的新闻文本分类

  2. 本文提出的基于事件卷积特征的模型,在利用事件含有语 义和语言结构信息的特点上,使用卷积神经网络提取事件特征, 并在新闻语料的分类上取得了良好的性能。
  3. 所属分类:机器学习

    • 发布日期:2017-10-27
    • 文件大小:621568
    • 提供者:xhw_wangning
  1. 复旦大学文本分类新闻语料(测试集+训练集)

  2. 编码格式为GBK。 是网上流传的测试集和训练集的合并版。 用户获取后要自行清洗语料。
  3. 所属分类:机器学习

    • 发布日期:2018-05-01
    • 文件大小:100663296
    • 提供者:feng2783581
  1. 中文新闻类分类语料,共4个类别,分别文化,财经,军事,运动

  2. 文本分训练和测试集,每个类别2000条新闻,简单做分类,测试效果 是足够了
  3. 所属分类:机器学习

    • 发布日期:2018-01-17
    • 文件大小:8388608
    • 提供者:ymmxz
  1. 中文情感分析语料

  2. 该资源包含计算机,酒店,蒙牛,热水器,手机,书籍,等方面,已分好类,有标签。总共将近30000条。还有搜狗新闻分类,和tr-croup-answer
  3. 所属分类:其它

    • 发布日期:2018-01-30
    • 文件大小:89128960
    • 提供者:weixin_38395744
  1. 搜狐新闻中文语料(已分类整理)

  2. 在搜狗实验室下载的搜狐新闻数据整理后的一部分中文分类语料~
  3. 所属分类:机器学习

    • 发布日期:2018-02-08
    • 文件大小:178257920
    • 提供者:wxxiangge
  1. 搜狗新闻分类语料

  2. 整理自搜狗实验室中的新闻分类。含有金融、体育、军事等11个分类集。
  3. 所属分类:数据库

    • 发布日期:2018-10-30
    • 文件大小:34603008
    • 提供者:makecontral
  1. 复旦新闻语料库训练集

  2. 复旦大学新闻语料库,此为训练集。使用请注明来源:复旦大学计算机信息与科学技术系国际数据库中心自然语言处理小组
  3. 所属分类:机器学习

    • 发布日期:2018-11-07
    • 文件大小:29360128
    • 提供者:ydf_micro
  1. 复旦新闻语料库测试集

  2. 复旦大学新闻语料库,此为测试集。使用请注明来源:复旦大学计算机信息与科学技术系国际数据库中心自然语言处理小组
  3. 所属分类:机器学习

    • 发布日期:2018-11-07
    • 文件大小:29360128
    • 提供者:ydf_micro
  1. 复旦新闻语料库训练+测试

  2. 复旦大学新闻语料库,该版本已转为UTF-8格式,包含训练集和测试集。使用请注明来源:复旦大学计算机信息与科学技术系国际数据库中心自然语言处理小组
  3. 所属分类:机器学习

    • 发布日期:2018-11-07
    • 文件大小:123731968
    • 提供者:ydf_micro
  1. 中文文本分类_新闻语料库.zip

  2. 做毕设自用的中文新闻文本分类语料库,整理自搜狗新闻和清华新闻语料,共八个类别,每类已分好4000条训练集和1000条测试集。附赠一份停用词表,综合了哈工大停用词及川大停用词。
  3. 所属分类:机器学习

    • 发布日期:2020-04-06
    • 文件大小:49283072
    • 提供者:qq_39496504
  1. 新闻分类语料

  2. 新闻分类语料,9个类别财经,教育,军事,科技,政治等 按新闻标签爬取的。 新闻分类语料,9个类别财经,教育,军事,科技,政治等 按新闻标签爬取的。
  3. 所属分类:其它

    • 发布日期:2020-01-30
    • 文件大小:18874368
    • 提供者:nujusinu
  1. text-classification-cn:中文文本分类实践,基于搜狗新闻语料库,采用传统机器学习方法以及预训练模型等方法-源码

  2. 文字分类 文本分类(文本分类)是自然语言处理中的一个重要应用技术,根据文档的内容或主题,自动识别文档所属的预先定义的类别标签。文本分类是很多应用场景的基础,某些垃圾邮件识别,舆情分析,情感识别,新闻自动分类,智能客服机器人的合并分类等等。此处分为两个部分: 第1部分:基于scikit学习机器学习的Python库,对比几个传统机器学习方法的文本分类 第2部分:基于预训练词向量模型,使用Keras工具进行文本分类,用到了CNN 本文语料:,密码:P9M4。更多新闻标注语料,。 预训练词向量模型来自
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:212972
    • 提供者:weixin_42101237
  1. TextClassification:基于scikit-learn实现对新浪新闻的文本分类,数据集为100w篇文档,总计10类,测试集与训练集1:1划分。分类算法采用SVM和Bayes,其中Bayes作为基线-源码

  2. 新浪新闻文本分类 语料库重建 本项目的语料来源新浪新闻网,通过spider.py爬虫模块获得全部语料,总计获得10类新闻文本,每一类新闻文本有10条。 采纳新浪新闻网的一个api获取新闻文本,api的url为 使用进度池并发执行爬虫,加快抓取速度。 数据预处理 本项目的数据预处理包括:分词处理,去噪,向量化,由stopwords.py模块,text2term.py模块,vectorizer.py模块实现。 本项目借助第三方库解霸完成文本的分词处理。 通过停用词表移除中文停用词,通过正则表达式消除
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:100352
    • 提供者:weixin_42128270
« 12 3 »