搜索资源 - nlp文本分类-数据集 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - nlp文本分类-数据集

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

NLP实战之sklearn+逻辑回归进行THUCNews文本分类python
通过对数据进行分词、停词过滤、TfidfVectorizer/CountVectorizer处理，利用sklearn中是逻辑回归对THUCNews进行分类，包含数据集
所属分类：机器学习
- 发布日期：2020-05-20
- 文件大小：50331648
- 提供者：m0_37723079

论文分类数据集请配合文章使用
配合文章使用，该文章通过nlp+聚类算法实现文本分类处理。简单易懂，配合代码使用理解迅速，适合自然语言处理和非监督学习的初学者们，希望能帮助大家
所属分类：机器学习
- 发布日期：2020-05-16
- 文件大小：125952
- 提供者：OldDriver1995

Chinese-NLP-Corpus.zip
文本分类数据集（BDCI_Car_2018）、中文NER数据集（MSRA、People's Daily、Weibo）。
所属分类：深度学习
- 发布日期：2020-01-13
- 文件大小：7340032
- 提供者：Hunter_Murphy

文本分类相关程序和数据，包括TextCNN RNN CRF等
其中包括程序项目三个， Text CNN，RNN＋CRT，CNN＋LSTM的文本分类。包括数据训练集和测试集。文本分类是NLP的基础任务，掌握它是进阶的基础 enjoy
所属分类：深度学习
- 发布日期：2020-12-15
- 文件大小：265289728
- 提供者：weixin_41956783

使用pytorch和torchtext进行文本分类的实例
文本分类是NLP领域的较为容易的入门问题，本文记录我自己在做文本分类任务以及复现相关论文时的基本流程，绝大部分操作都使用了torch和torchtext两个库。 1. 文本数据预处理首先数据存储在三个csv文件中，分别是train.csv，valid.csv，test.csv，第一列存储的是文本数据，例如情感分类问题经常是用户的评论review，例如imdb或者amazon数据集。第二列是情感极性polarity，N分类问题的话就有N个值，假设值得范围是0~N-1。下面是很常见的文本预处理流
所属分类：其它
- 发布日期：2020-12-23
- 文件大小：102400
- 提供者：weixin_38706603

零基础入门NLP-新闻文本分类-数据集
所属分类：其它
- 发布日期：2021-03-25
- 文件大小：309329920
- 提供者：weixin_38722052

NLP-Classification-源码
NLP分类这是一个NLP文本分类项目，预测在各种数据集上测试不同模型的表现。目前的数据集有：数据库目前的模型有： LSTM 迪尔斯·伯特
所属分类：其它
- 发布日期：2021-03-21
- 文件大小：38912
- 提供者：weixin_42122881

零基础入门NLP - 新闻文本分类比赛数据-数据集
新闻文本分类 https://tianchi.aliyun.com/competition/entrance/531810/information test_a_sample_submit.csv test_a.csv train_set.csv
所属分类：其它
- 发布日期：2021-03-19
- 文件大小：309329920
- 提供者：weixin_38538264

nlp文本分类-数据集
文本分类 test_a.csv train_set.csv
所属分类：其它
- 发布日期：2021-03-12
- 文件大小：309329920
- 提供者：weixin_38724229

新闻文本分类-数据集
零基础入门NLP-新闻文本分类 test_b.csv test_a_sample_submit.csv test_a.csv test_b_sample_submit.csv train_set.csv
所属分类：其它
- 发布日期：2021-03-11
- 文件大小：371195904
- 提供者：weixin_38710127

Aspect-Based-Sentiment-Analysis:一个为SemEval 2016数据集实现基于方面的情感分析分类系统的python程序-源码
基于方面的情感分析基于方面的情感分析任务专注于识别方面类别和文本中的情绪（正面，负面，中性）分类。基于方面的情感分析的目的是确定针对特定方面表达的情感极性。该系统基于使用支持向量机（SVM）的监督学习。多标签svc分类器用于将笔记本电脑评论分为20个方面类别，还可以将评论分为正面，负面或中性。对于每种情感，都使用多标签svc分类器。系统的性能也与其他分类器进行了比较。数据集所需的库 Scikit学习纳尔特克大熊猫麻木 PS：这是加德满都大学计算机科学与工程系最后一年的一个为
所属分类：其它
- 发布日期：2021-03-11
- 文件大小：547840
- 提供者：weixin_42137723

baidu_nlp_project2:开课吧＆后厂理工学院_百度NLP项目2：试题数据集多标签文本分类-源码
baidu_nlp_project2 开课吧＆后厂理工学院百度NLP项目2：百度试题数据集多标签文本分类 1.数据说明原始数据集为高中下地理，历史，生物，政治四门学科数据，每个学科下各包含第一层知识点，如历史下分为近代史，现代史，古代史。原始数据示例： [翻译]率先实行包产到组，包产到户的农业生产责任制的省份是（） ①四川②广东③安徽④湖北A。 ①③B。 ①④C。 ②④D。 ②③题型：单选题|缺点：简单|使用次数：0 |纠错复制收藏到空间加入选题篮查看答案解析：A解析：本题主要考察的是对知识
所属分类：其它
- 发布日期：2021-03-09
- 文件大小：20480
- 提供者：weixin_42138376

新闻文本分类-数据集
零基础入门NLP - 新闻文本分类 NLP_data_list_0715.csv
所属分类：其它
- 发布日期：2021-03-06
- 文件大小：370
- 提供者：weixin_38715721

poem_generation:用于测试文本生成方法（例如LSTM，VAE等）和不同转换器的存储库-源码
NLP-诗歌在过去的十年中，自然语言处理（NLP）的发展非常Swift。这是一个非常复杂的领域，并且一直在进步。此回购旨在针对特定类型的语料诗尝试一些NLP任务和算法。这些诗是从刮下来的，可以在找到刮取的代码任务类型使用此存储库中的ata可以执行两个主要任务：文本生成-生成诗歌文本分类-对主题或诗歌形式进行分类数据集该数据集由两个文件夹组成，两个文件夹都包含诗歌的子文件夹。这些诗歌按形式（例如句，十四行诗等）或主题（爱，自然，欢乐，和平等）分类。由于数据采用这种结构
所属分类：其它
- 发布日期：2021-03-06
- 文件大小：16777216
- 提供者：weixin_42116650

情感发现：用于大规模情感分类的无监督语言建模-源码
**已弃用** 此仓库已被弃用。请访问以获取我们最新的大规模无监督预训练和微调代码。如果您仍想使用此代码库，请参阅带有标签的发行版，并安装必需的软件/相关性，这些软件/相关性在该日期公开发布。 PyTorch无监督情绪发现该代码库包含预训练的二进制情感和多模型情感分类模型，以及用于重现我们一系列大规模预训练+传输NLP论文的结果的代码：并。这项工作源于对OpenAI的“论文进行复制，分析和缩放的愿望。该存储库中使用的技术是通用的，我们易于使用的命令行界面可用于在您自己的困难分类数
所属分类：其它
- 发布日期：2021-02-27
- 文件大小：56623104
- 提供者：weixin_42122878

nfr-classification：用于构建nlp文本分类的简单jupyter笔记本-源码
来自PROMISE数据集的NFR分类
所属分类：其它
- 发布日期：2021-02-20
- 文件大小：7340032
- 提供者：weixin_42161497

spam-ham-web-app：一个将文本分类为垃圾邮件或火腿的Web应用程序。我在后端使用自己的ML算法，该代码可在machine_learning_section下找到。对于现场演示：签出此链接-源码
垃圾邮件 SpamHam是一个文本分类应用程序，可以检测邮件/电子邮件是否为垃圾邮件。我已经将Naive-Bayes与NLP（TF-IDF，Bag of Words等）一起使用。为了进行实验，我将两个数据集（Enron电子邮件垃圾邮件/火腿和SMS垃圾邮件分类）组合在一起以收集更多数据。，明白我的意思。要查看该项目的实际操作，我已将其部署在heroku上。建于 Django 2.1 Python 3.6 Scikit学习脾气暴躁的大熊猫 Matplotlib 海生 HTML5
所属分类：其它
- 发布日期：2021-02-04
- 文件大小：1048576
- 提供者：weixin_42142062

VDCNN：用于文本分类的超深度卷积神经网络的实现-源码
直流神经网络 Conneau提出的用于文本分类的超深度卷积神经网络的Tensorflow实现。现在已使用Tensorflow 2和tf.keras支持正确重新实现了VDCNN的体系结构。根据实施一个简单的培训界面。随意贡献其他实用程序，例如TensorBoard支持。旁注，如果您是NLP文本分类的新手：请检出新的SOTA NLP方法，例如或。检出以获得更好的动态绘图和数据集对象支持。当前的VDCNN实现也非常容易移植到PyTorch上。先决条件 Python3 Te
所属分类：其它
- 发布日期：2021-02-03
- 文件大小：7168
- 提供者：weixin_42156940

Chatito：using使用简单的DSL生成AI聊天机器人，NLP任务，命名实体识别或文本分类模型的数据集！-源码
Chatito 总览 Chatito可帮助您使用简单的DSL生成用于训练和验证chatbot模型的数据集。如果要使用商业模型，开源框架或编写自己的自然语言处理模型来构建聊天机器人，则需要培训和测试示例。 Chatito在这里为您提供帮助。该项目包含：聊天语言有关完整的语言规范和文档，请参考。提示防止过度拟合如果我们正确使用Chatito，则可以避免过度的问题。该工具背后的思想是在数据扩充和可能的句子组合的描述之间有一个交集。它不打算生成可能适合单个句子模型的确定性数据集
所属分类：其它
- 发布日期：2021-02-03
- 文件大小：350208
- 提供者：weixin_42166918

text_classification：具有深度学习功能的各种文本分类模型等-源码
文字分类该存储库的目的是通过深度学习探索NLP中的文本分类方法。更新：中文语言理解评估基准（）：用一行代码运行10个任务和9个基准，并进行详细的性能比较。释放预训练模型使用30G +中国原始语料库，xxlarge，xlarge等进行中文培训，目标是与中国国庆日2019年10月7日的最新汉语表演相匹配！ Google的BERT使用语言模型的预训练在NLP的10多个任务上取得了最新的成果，然后微调。介绍它具有用于文本分类的各种基准模型。它还支持多标签分类，其中多标签与句子或
所属分类：其它
- 发布日期：2021-02-03
- 文件大小：14680064
- 提供者：weixin_42132056

« 12 3 »