搜索资源 - 新闻文本分类数据-数据集 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 新闻文本分类数据-数据集

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

【深度学习数据集】今日头条38万条新闻数据
今日头条38万条新闻数据，可用于文本分类模型训练，可用LSTM模型训练
所属分类：深度学习
- 发布日期：2018-10-12
- 文件大小：26214400
- 提供者：qq_35825325

Python-今日头条中文新闻文本多层分类数据集
今日头条中文新闻文本(多层)分类数据集
所属分类：其它
- 发布日期：2019-08-10
- 文件大小：308281344
- 提供者：weixin_39840650

基于双向GRU和贝叶斯分类器的文本分类
基于BiGRU和贝叶斯分类器的文本分类，利用搜狐新闻数据集进行实现，对12个种类进行分类，里面设计BiGRUB提取文本特征，TF-IDF特征权重赋值，Bytes分类进行实现，学习深度学习和机器学习很好的借鉴。
所属分类：互联网
- 发布日期：2020-06-10
- 文件大小：105472
- 提供者：wws_2017

大规模新闻文本分类数据集
大规模新闻文本分类数据集，有多个领域，按文件夹摆放，不仅可以用来做文本分类实验，数据不少甚至可以用来做BERT预训练
所属分类：深度学习
- 发布日期：2020-07-01
- 文件大小：1073741824
- 提供者：guotong1988

cnews中文文本分类数据集
cnews中文文本分类数据集；由清华大学根据新浪新闻RSS订阅频道2005-2011年间的历史数据筛选过滤生成，训练过程见我的博客；
所属分类：深度学习
- 发布日期：2020-07-17
- 文件大小：44040192
- 提供者：rongsenmeng2835

头条新闻文本分类数据集
头条新闻文本分类数据集，包括11个类别，近50万条数据，文本内容为新闻标题+提取的关键词，分为训练数据和验证数据两个文件
所属分类：深度学习
- 发布日期：2020-09-23
- 文件大小：12582912
- 提供者：cuiwow

零基础入门NLP-新闻文本分类-数据集
所属分类：其它
- 发布日期：2021-03-25
- 文件大小：309329920
- 提供者：weixin_38722052

新闻文本分类数据-数据集
新闻文本分类比赛的训练数据和测试数据
所属分类：其它
- 发布日期：2021-03-25
- 文件大小：309329920
- 提供者：weixin_38682086

新闻文本分类-数据集
train_set.csv test_a.csv
所属分类：其它
- 发布日期：2021-03-19
- 文件大小：309329920
- 提供者：weixin_38547409

零基础入门NLP - 新闻文本分类比赛数据-数据集
新闻文本分类 https://tianchi.aliyun.com/competition/entrance/531810/information test_a_sample_submit.csv test_a.csv train_set.csv
所属分类：其它
- 发布日期：2021-03-19
- 文件大小：309329920
- 提供者：weixin_38538264

新闻文本分类数据集-数据集
天池比赛新闻文本分类数据集 test_a.csv train_set.csv
所属分类：其它
- 发布日期：2021-03-19
- 文件大小：309329920
- 提供者：weixin_38514501

Text-classification:不使用现有的库使用朴素贝叶斯和感知机实现文本分类-源码
文字分类训练一个分类器（KNN，SVM），对文本数据进行分类，类别可包括体育，财经，房地产，家居，教育等十个类别。文本分类的一般流程可以分为五步：（1）对文本进行预处理，包括分词操作和替换词去除等；（2）特征提取与特征选择，选择文本特征提取方法，替代特征进行选择（3）文本表示，选择合适的方法表示选择的特征，作为分类的依据；（4）分类器构建，选择合适的分类算法训练得到对应的文本分类器；结果评估，选择合适的评估指标，对分类结果进行评价＃实验内容1.构建数据集2.数据预处理（分词，去除重置词）3
所属分类：其它
- 发布日期：2021-03-17
- 文件大小：2048
- 提供者：weixin_42099302

新闻文本分类-数据集
零基础入门NLP-新闻文本分类 test_b.csv test_a_sample_submit.csv test_a.csv test_b_sample_submit.csv train_set.csv
所属分类：其它
- 发布日期：2021-03-11
- 文件大小：371195904
- 提供者：weixin_38710127

THUCNews新闻文本分类数据集
包含体育、游戏等10个类别，共60000多条数据格式：标签\t文本语料
所属分类：互联网
- 发布日期：2021-03-07
- 文件大小：69206016
- 提供者：weixin_44067742

文本分类数据-数据集
新闻文本分类数据 NLP_data_list_0715.csv
所属分类：其它
- 发布日期：2021-03-06
- 文件大小：370
- 提供者：weixin_38656400

新闻文本分类-数据集
零基础入门NLP - 新闻文本分类 NLP_data_list_0715.csv
所属分类：其它
- 发布日期：2021-03-06
- 文件大小：370
- 提供者：weixin_38715721

基于tensorflow、CNN、清华数据集THUCNews的新浪新闻文本分类-附件资源
基于tensorflow、CNN、清华数据集THUCNews的新浪新闻文本分类-附件资源
所属分类：互联网
- 发布日期：2021-03-05
- 文件大小：106
- 提供者：weixin_42200791

基于tensorflow、CNN、清华数据集THUCNews的新浪新闻文本分类-附件资源
基于tensorflow、CNN、清华数据集THUCNews的新浪新闻文本分类-附件资源
所属分类：互联网
- 发布日期：2021-03-05
- 文件大小：106
- 提供者：weixin_42203424

基于tensorflow、CNN、清华数据集THUCNews的新浪新闻文本分类-附件资源
基于tensorflow、CNN、清华数据集THUCNews的新浪新闻文本分类-附件资源
所属分类：互联网
- 发布日期：2021-03-02
- 文件大小：23
- 提供者：weixin_42203424

TextClassification：基于scikit-learn实现对新浪新闻的文本分类，数据集为100w篇文档，总计10类，测试集与训练集1：1划分。分类算法采用SVM和Bayes，其中Bayes作为基线-源码
新浪新闻文本分类语料库重建本项目的语料来源新浪新闻网，通过spider.py爬虫模块获得全部语料，总计获得10类新闻文本，每一类新闻文本有10条。采纳新浪新闻网的一个api获取新闻文本，api的url为使用进度池并发执行爬虫，加快抓取速度。数据预处理本项目的数据预处理包括：分词处理，去噪，向量化，由stopwords.py模块，text2term.py模块，vectorizer.py模块实现。本项目借助第三方库解霸完成文本的分词处理。通过停用词表移除中文停用词，通过正则表达式消除
所属分类：其它
- 发布日期：2021-02-03
- 文件大小：100352
- 提供者：weixin_42128270

« 12 3 4 5 »