搜索资源 - reddit-nlp-源码 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - reddit-nlp-源码

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

-DSI-Project03:NLP Subreddit分类-源码
项目3-Subreddit上的Web API和分类该项目的目的是从Reddit中选择两个子Reddit，并使用自然语言处理和分类模型将帖子分类为正确的子Reddit。我选择潜水潜水和远足潜水作为我感兴趣的两个主题，因为这两个主题都在同一主要社区“旅行”下，但又有足够的差异，因此应该有可能训练机器学习模型。问题陈述近年来，流浪汉变得越来越世俗，对冒险的渴望增加了。水肺潜水和远足是一项冒险运动，使我们能够探索水上和水下的世界。因此，对于需要在互联网人群中寻找冒险旅行者的旅行社而言。因此，通过
所属分类：其它
- 发布日期：2021-03-19
- 文件大小：2048
- 提供者：weixin_42129005

Predicting-the-popularity-of-Reddit-posts:给定一个Reddit帖子，我们希望通过收到的赞数来预测其受欢迎程度。帖子收到的投票数量会影响其在网站上的可见性。因此，重要的是要了解帖子功能对其受欢迎程度的
预测Reddit帖子的受欢迎程度给定一个Reddit帖子，我们希望通过收到的赞数来预测其受欢迎程度。帖子收到的投票数量会影响其在网站上的可见性。因此，重要的是要了解帖子功能对其受欢迎程度的相对重要性。除了使用各种机器学习模型来发布元数据以外，我们还将利用诸如GloVe词嵌入和情感分类之类的NLP技术来解决此问题。
所属分类：其它
- 发布日期：2021-03-18
- 文件大小：140288
- 提供者：weixin_42162171

reddit-nlp-源码
reddit-nlp
所属分类：其它
- 发布日期：2021-03-16
- 文件大小：30720
- 提供者：weixin_42116596

quote-me-ai:行情生成机器人-源码
引用我的AI Quote Me AI是生成报价的机器人，其唯一目的是生成唯一的报价。生成的报价被绘制到图像上并发布到subreddit 。样品使用的图书馆 GPT-2-simple-文本生成 Unsplash API-照片搜索 spacy-NLP任务（词嵌入，相似性搜索）船首-将报价图像发布到subreddit 工作流程图如何使用安装库pip install -r requirements.txt 将config_template.py重命名为config.py并填写未启动，
所属分类：其它
- 发布日期：2021-03-15
- 文件大小：49283072
- 提供者：weixin_42160645

语言分类-源码
顶点：语言分类卢克·赫林加数据科学沉浸式遥控器（DSIR-113020） 2021年3月4日问题陈述执行摘要该项目的范围旨在涵盖Web API的使用，自然语言处理（NLP）以及分类模型的比较。首先，使用Pushshift reddit API从子Reddit r / Coffee和r / tea收集5000个帖子。清洗后，将剩余的4607个帖子标题和相关的subreddit标签分为一个训练集（数据的75％）和一个测试集（数据的25％）。然后对多种NLP技术和分类模型进行了测试，
所属分类：其它
- 发布日期：2021-03-04
- 文件大小：2097152
- 提供者：weixin_42133680

WSB帖子：对“华尔街赌注”上的帖子的分析-源码
WSB帖子 :building_construction: 正在施工:construction: :building_construction: 《华尔街下注》帖子分析（此处的数据集： : ）。当前：编写快速的Spark管道以正确处理Reddit帖子。下一步：Spark NLP中的主题建模。之后：聚类，汇总，并将其映射到主题模型上？
所属分类：其它
- 发布日期：2021-02-18
- 文件大小：4194304
- 提供者：weixin_42108778

Reddit-Hate-Detection：该项目将Web爬网与NLP相结合，以检测，量化和分类Reddit社区上的仇恨言论-源码
Reddit仇恨检测
所属分类：其它
- 发布日期：2021-02-18
- 文件大小：15360
- 提供者：weixin_42134769

沙盒-源码
804-Coke Hackathon-Lasso回归模型，用于预测限时产品对类别销售的影响。使用DataBricks汇总所有横幅上的POS数据，用于预测的线性回归模型以及对系数的分析，以为围绕品牌/口味的决策提供依据。 R ^ 2为90.34％。 823-使用Reddit News预测DJIA-预测明天DJIA收市价的上涨或下跌的分类问题。使用NLP，功能工程和堆叠集成可在固定测试集上产生69％的精度。与Hamza Munir合作 831-客户购买倾向-电子商务商店数据集的分类，用于
所属分类：其它
- 发布日期：2021-02-15
- 文件大小：5242880
- 提供者：weixin_42132598

NLP-snowboarding-vs-skiing：创建分类模型以区分两个subreddit通道滑雪和滑雪，并使用情感分析来比较两者-源码
伯顿滑雪板：单板滑雪与滑雪：伯顿（Burton）是否应该进入滑雪市场？问题陈述伯顿滑雪板正在考虑进入滑雪市场。为了弄清楚他们是否应该进入滑雪市场，伯顿滑雪板公司带我去了解与滑雪板相似的滑雪者。我查看了有关滑雪者和滑雪者如何谈论各自运动的评论数据，以及他们对于在山上滑雪的看法，以了解是否可以像伯顿向滑雪者那样推销滑雪者。执行摘要为了弄清楚是否可以使用与Burton相似的方法来销售滑雪者，我研究了滑雪和滑雪的子项，以分析滑雪者和滑雪者的言论。我使用pushshift API总共提取了
所属分类：其它
- 发布日期：2021-02-14
- 文件大小：6291456
- 提供者：weixin_42137032

Reddit-NLP-源码
项目3：Web API和NLP 问题陈述通过使用带有不同矢量化器的各种模型，我想通过分析用户在不同子reddit中使用的词来确定模型是否可以准确预测用户的成熟度/年龄。我将从每个subreddit，r / Teenagers和r / Adulting收集5,000行数据，并使用这些数据来训练我的朴素贝叶斯和KNN模型。我的目标是确定在两个子Reddit中的任何一个中使用的关键字，创建停用词，并确定模型中的最佳超参数。使用的内容和数据笔记本（按顺序）数据采集 Adulting_D
所属分类：其它
- 发布日期：2021-02-10
- 文件大小：5242880
- 提供者：weixin_42128015

广告牌：Bill 1950-2015年Billboard的Top 100歌词相关的NLP数据-源码
介绍自1950年以来，我们的项目研究并可视化了流行歌曲的歌词和相关数据的演变方式。我们每年夺取Billboard上排名前100位的歌曲，并使用自然语言处理来分析各种指标。用户可以交互地选择他们感兴趣的年份/类型范围，以更仔细地了解细微之处。 Lee Juhee Lee，Yinan Wen和联合项目数据检索/分析广告牌前100首歌曲我们唯一的初始数据集来自Billboard的前100名。我们从reddit的r / datasets中获取了1950年至2015年前100首歌曲的。歌词
所属分类：其它
- 发布日期：2021-02-05
- 文件大小：3145728
- 提供者：weixin_42099814

NLP情感：使用NLTK，Scikit-Learn和Keras对亚马逊产品评论进行情感分析。使用超参数搜索和LSTM，我们最好的模型可达到约96％的精度-源码
亚马逊评论情绪分析情感分析一直在增长-既由于深度学习中使用了新的分析技术，又因为到处都有大量的数据生成。每条产品评论，每条推文，每条Reddit帖子等均包含我们希望能够处理和理解的主观信息。例如，假设您是Netflix。然后，您对客户对您的服务和电视节目/电影选择要说的话非常感兴趣，并且您可能会希望挖掘Facebook帖子和推文以及IMDB评论等，以评估公众意见。如果您是一名政客，那么您（希望）对选民的想法，他们想要什么，他们持有哪些宝贵价值观等感兴趣，因此您可能会有一个团队来分析这
所属分类：其它
- 发布日期：2021-02-04
- 文件大小：37888
- 提供者：weixin_42117340

subreddit-analyzer：全面的数据和文本挖掘工作流程，可处理来自任何给定公共subreddit的提交和评论-源码
Subreddit分析器该项目记录了使用Pushshift API下载大量Reddit提交和评论的过程，以获取有趣的见解，例如按工作日，小时和最常用词的分发方式。该项目分为三个主要部分，即ETL过程，NLP管道以及图表和见解的生成。以下是所包含脚本的摘要： subreddit_comments.py-一个Python脚本，可从Pushshift API下载固定数量的注释。 subreddit_submissions.py-一个Python脚本，可从Pushshift API下载固定
所属分类：其它
- 发布日期：2021-02-03
- 文件大小：18874368
- 提供者：weixin_42169674

textacy：NLP，spaCy之前和之后-源码
textacy：NLP，spaCy之前和之后 textacy是一个基于高性能spaCy库的Python库，用于执行各种自然语言处理（NLP）任务。通过将基础知识-令牌化，词性标记，依赖项解析等-委托给另一个库， textacy主要关注于之前和之后的任务。产品特点通过用于处理一个或多个文档的便捷方法访问spaCy，并通过自定义扩展名和自动语言识别扩展其功能，从而为文本应用正确的spaCy管道下载包含文本内容和元数据的数据集，从国会演讲到历史文献再到Reddit评论轻松以多种常用格式在磁盘
所属分类：其它
- 发布日期：2021-02-03
- 文件大小：319488
- 提供者：weixin_42099176