您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 【深度学习数据集】今日头条38万条新闻数据

  2. 今日头条38万条新闻数据,可用于文本分类模型训练,可用LSTM模型训练
  3. 所属分类:深度学习

    • 发布日期:2018-10-12
    • 文件大小:26214400
    • 提供者:qq_35825325
  1. Python-今日头条中文新闻文本多层分类数据集

  2. 今日头条中文新闻文本(多层)分类数据集
  3. 所属分类:其它

    • 发布日期:2019-08-10
    • 文件大小:308281344
    • 提供者:weixin_39840650
  1. 基于双向GRU和贝叶斯分类器的文本分类

  2. 基于BiGRU和贝叶斯分类器的文本分类,利用搜狐新闻数据集进行实现,对12个种类进行分类,里面设计BiGRUB提取文本特征,TF-IDF特征权重赋值,Bytes分类进行实现,学习深度学习和机器学习很好的借鉴。
  3. 所属分类:互联网

    • 发布日期:2020-06-10
    • 文件大小:105472
    • 提供者:wws_2017
  1. 大规模新闻文本分类数据集

  2. 大规模新闻文本分类数据集,有多个领域,按文件夹摆放,不仅可以用来做文本分类实验,数据不少甚至可以用来做BERT预训练
  3. 所属分类:深度学习

    • 发布日期:2020-07-01
    • 文件大小:1073741824
    • 提供者:guotong1988
  1. cnews中文文本分类数据集

  2. cnews中文文本分类数据集;由清华大学根据新浪新闻RSS订阅频道2005-2011年间的历史 数据筛选过滤生成,训练过程见我的博客;
  3. 所属分类:深度学习

    • 发布日期:2020-07-17
    • 文件大小:44040192
    • 提供者:rongsenmeng2835
  1. 头条新闻文本分类数据集

  2. 头条新闻文本分类数据集,包括11个类别,近50万条数据,文本内容为新闻标题+提取的关键词,分为训练数据和验证数据两个文件
  3. 所属分类:深度学习

    • 发布日期:2020-09-23
    • 文件大小:12582912
    • 提供者:cuiwow
  1. 零基础入门NLP-新闻文本分类-数据集

  2. 所属分类:其它

    • 发布日期:2021-03-25
    • 文件大小:309329920
    • 提供者:weixin_38722052
  1. 新闻文本分类数据-数据集

  2. 新闻文本分类比赛的训练数据和测试数据
  3. 所属分类:其它

    • 发布日期:2021-03-25
    • 文件大小:309329920
    • 提供者:weixin_38682086
  1. 新闻文本分类-数据集

  2. train_set.csv test_a.csv
  3. 所属分类:其它

    • 发布日期:2021-03-19
    • 文件大小:309329920
    • 提供者:weixin_38547409
  1. 零基础入门NLP - 新闻文本分类 比赛数据-数据集

  2. 新闻文本分类 https://tianchi.aliyun.com/competition/entrance/531810/information test_a_sample_submit.csv test_a.csv train_set.csv
  3. 所属分类:其它

    • 发布日期:2021-03-19
    • 文件大小:309329920
    • 提供者:weixin_38538264
  1. 新闻文本分类数据集-数据集

  2. 天池比赛 新闻文本分类数据集 test_a.csv train_set.csv
  3. 所属分类:其它

    • 发布日期:2021-03-19
    • 文件大小:309329920
    • 提供者:weixin_38514501
  1. Text-classification:不使用现有的库使用朴素贝叶斯和感知机实现文本分类-源码

  2. 文字分类 训练一个分类器(KNN,SVM),对文本数据进行分类,类别可包括体育,财经,房地产,家居,教育等十个类别。 文本分类的一般流程可以分为五步:(1)对文本进行预处理,包括分词操作和替换词去除等;(2)特征提取与特征选择,选择文本特征提取方法,替代特征进行选择(3)文本表示,选择合适的方法表示选择的特征,作为分类的依据;(4)分类器构建,选择合适的分类算法训练得到对应的文本分类器;结果评估,选择合适的评估指标,对分类结果进行评价 #实验内容1.构建数据集2.数据预处理(分词,去除重置词)3
  3. 所属分类:其它

    • 发布日期:2021-03-17
    • 文件大小:2048
    • 提供者:weixin_42099302
  1. 新闻文本分类-数据集

  2. 零基础入门NLP-新闻文本分类 test_b.csv test_a_sample_submit.csv test_a.csv test_b_sample_submit.csv train_set.csv
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:371195904
    • 提供者:weixin_38710127
  1. THUCNews新闻文本分类数据集

  2. 包含体育、游戏等10个类别,共60000多条数据 格式:标签\t文本语料
  3. 所属分类:互联网

    • 发布日期:2021-03-07
    • 文件大小:69206016
    • 提供者:weixin_44067742
  1. 文本分类数据-数据集

  2. 新闻文本分类数据 NLP_data_list_0715.csv
  3. 所属分类:其它

  1. 新闻文本分类-数据集

  2. 零基础入门NLP - 新闻文本分类 NLP_data_list_0715.csv
  3. 所属分类:其它

  1. 基于tensorflow、CNN、清华数据集THUCNews的新浪新闻文本分类-附件资源

  2. 基于tensorflow、CNN、清华数据集THUCNews的新浪新闻文本分类-附件资源
  3. 所属分类:互联网

  1. 基于tensorflow、CNN、清华数据集THUCNews的新浪新闻文本分类-附件资源

  2. 基于tensorflow、CNN、清华数据集THUCNews的新浪新闻文本分类-附件资源
  3. 所属分类:互联网

  1. 基于tensorflow、CNN、清华数据集THUCNews的新浪新闻文本分类-附件资源

  2. 基于tensorflow、CNN、清华数据集THUCNews的新浪新闻文本分类-附件资源
  3. 所属分类:互联网

  1. TextClassification:基于scikit-learn实现对新浪新闻的文本分类,数据集为100w篇文档,总计10类,测试集与训练集1:1划分。分类算法采用SVM和Bayes,其中Bayes作为基线-源码

  2. 新浪新闻文本分类 语料库重建 本项目的语料来源新浪新闻网,通过spider.py爬虫模块获得全部语料,总计获得10类新闻文本,每一类新闻文本有10条。 采纳新浪新闻网的一个api获取新闻文本,api的url为 使用进度池并发执行爬虫,加快抓取速度。 数据预处理 本项目的数据预处理包括:分词处理,去噪,向量化,由stopwords.py模块,text2term.py模块,vectorizer.py模块实现。 本项目借助第三方库解霸完成文本的分词处理。 通过停用词表移除中文停用词,通过正则表达式消除
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:100352
    • 提供者:weixin_42128270
« 12 3 4 5 »