搜索资源 - 新闻分类语料 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 新闻分类语料

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

搜狗新闻语料库转存数据库java程序
整理搜狗2008版搜狗新闻分类语料库和全网新闻分类语料库--转存至mysql数据库
所属分类：Java
- 发布日期：2011-06-08
- 文件大小：22528
- 提供者：raindreams

网易新闻语料库文本分类自然语言处理
网易新闻语料库文本分类自然语言处理网上基本找不到哦~~
所属分类：其它
- 发布日期：2013-12-11
- 文件大小：38797312
- 提供者：llwszjj

新闻分类语料
新闻分类语料，9个类别财经，教育，军事，科技，政治等按新闻标签爬取的。
所属分类：其它
- 发布日期：2015-09-16
- 文件大小：18874368
- 提供者：baidu_26550817

新闻语料库
包含2015年一整年的新闻，文件以txt形式存储，是从各大网站上爬取下来的。希望喜欢
所属分类：Java
- 发布日期：2016-09-11
- 文件大小：18874368
- 提供者：u013006982

文本分类语料库
所属分类：Java
- 发布日期：2016-12-16
- 文件大小：30408704
- 提供者：zht0627

搜狐新闻分类语料库
搜狐新闻分类语料库，主要包含 0 汽车 1 财经 2 IT 3 健康 4 体育 5 旅游 6 教育 7 招聘 8 文化 9 军事十个分类，共50多万条记录
所属分类：机器学习
- 发布日期：2017-06-19
- 文件大小：68157440
- 提供者：whzhaochao

搜狗实验室新闻分类语料库
搜狗实验室新闻分类语料库，主要有10个分类，共50多万条记录 0 汽车 1 财经 2 IT 3 健康 4 体育 5 旅游 6 教育 7 招聘 8 文化 9 军事
所属分类：机器学习
- 发布日期：2017-06-19
- 文件大小：26214400
- 提供者：whzhaochao

基于事件卷积特征的新闻文本分类
本文提出的基于事件卷积特征的模型，在利用事件含有语义和语言结构信息的特点上，使用卷积神经网络提取事件特征，并在新闻语料的分类上取得了良好的性能。
所属分类：机器学习
- 发布日期：2017-10-27
- 文件大小：621568
- 提供者：xhw_wangning

复旦大学文本分类新闻语料（测试集+训练集）
编码格式为GBK。是网上流传的测试集和训练集的合并版。用户获取后要自行清洗语料。
所属分类：机器学习
- 发布日期：2018-05-01
- 文件大小：100663296
- 提供者：feng2783581

中文新闻类分类语料，共4个类别，分别文化，财经，军事，运动
文本分训练和测试集，每个类别2000条新闻，简单做分类，测试效果是足够了
所属分类：机器学习
- 发布日期：2018-01-17
- 文件大小：8388608
- 提供者：ymmxz

中文情感分析语料
该资源包含计算机，酒店，蒙牛，热水器，手机，书籍，等方面，已分好类，有标签。总共将近30000条。还有搜狗新闻分类，和tr-croup-answer
所属分类：其它
- 发布日期：2018-01-30
- 文件大小：89128960
- 提供者：weixin_38395744

搜狐新闻中文语料（已分类整理）
在搜狗实验室下载的搜狐新闻数据整理后的一部分中文分类语料~
所属分类：机器学习
- 发布日期：2018-02-08
- 文件大小：178257920
- 提供者：wxxiangge

搜狗新闻分类语料
整理自搜狗实验室中的新闻分类。含有金融、体育、军事等11个分类集。
所属分类：数据库
- 发布日期：2018-10-30
- 文件大小：34603008
- 提供者：makecontral

复旦新闻语料库训练集
复旦大学新闻语料库，此为训练集。使用请注明来源：复旦大学计算机信息与科学技术系国际数据库中心自然语言处理小组
所属分类：机器学习
- 发布日期：2018-11-07
- 文件大小：29360128
- 提供者：ydf_micro

复旦新闻语料库测试集
复旦大学新闻语料库，此为测试集。使用请注明来源：复旦大学计算机信息与科学技术系国际数据库中心自然语言处理小组
所属分类：机器学习
- 发布日期：2018-11-07
- 文件大小：29360128
- 提供者：ydf_micro

复旦新闻语料库训练+测试
复旦大学新闻语料库，该版本已转为UTF-8格式，包含训练集和测试集。使用请注明来源：复旦大学计算机信息与科学技术系国际数据库中心自然语言处理小组
所属分类：机器学习
- 发布日期：2018-11-07
- 文件大小：123731968
- 提供者：ydf_micro

中文文本分类_新闻语料库.zip
做毕设自用的中文新闻文本分类语料库，整理自搜狗新闻和清华新闻语料，共八个类别，每类已分好4000条训练集和1000条测试集。附赠一份停用词表，综合了哈工大停用词及川大停用词。
所属分类：机器学习
- 发布日期：2020-04-06
- 文件大小：49283072
- 提供者：qq_39496504

新闻分类语料
新闻分类语料，9个类别财经，教育，军事，科技，政治等按新闻标签爬取的。新闻分类语料，9个类别财经，教育，军事，科技，政治等按新闻标签爬取的。
所属分类：其它
- 发布日期：2020-01-30
- 文件大小：18874368
- 提供者：nujusinu

text-classification-cn：中文文本分类实践，基于搜狗新闻语料库，采用传统机器学习方法以及预训练模型等方法-源码
文字分类文本分类（文本分类）是自然语言处理中的一个重要应用技术，根据文档的内容或主题，自动识别文档所属的预先定义的类别标签。文本分类是很多应用场景的基础，某些垃圾邮件识别，舆情分析，情感识别，新闻自动分类，智能客服机器人的合并分类等等。此处分为两个部分：第1部分：基于scikit学习机器学习的Python库，对比几个传统机器学习方法的文本分类第2部分：基于预训练词向量模型，使用Keras工具进行文本分类，用到了CNN 本文语料：，密码：P9M4。更多新闻标注语料，。预训练词向量模型来自
所属分类：其它
- 发布日期：2021-02-04
- 文件大小：212972
- 提供者：weixin_42101237

TextClassification：基于scikit-learn实现对新浪新闻的文本分类，数据集为100w篇文档，总计10类，测试集与训练集1：1划分。分类算法采用SVM和Bayes，其中Bayes作为基线-源码
新浪新闻文本分类语料库重建本项目的语料来源新浪新闻网，通过spider.py爬虫模块获得全部语料，总计获得10类新闻文本，每一类新闻文本有10条。采纳新浪新闻网的一个api获取新闻文本，api的url为使用进度池并发执行爬虫，加快抓取速度。数据预处理本项目的数据预处理包括：分词处理，去噪，向量化，由stopwords.py模块，text2term.py模块，vectorizer.py模块实现。本项目借助第三方库解霸完成文本的分词处理。通过停用词表移除中文停用词，通过正则表达式消除
所属分类：其它
- 发布日期：2021-02-03
- 文件大小：100352
- 提供者：weixin_42128270

« 12 3 »