您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. -DSI-Project03:NLP Subreddit分类-源码

  2. 项目3-Subreddit上的Web API和分类 该项目的目的是从Reddit中选择两个子Reddit,并使用自然语言处理和分类模型将帖子分类为正确的子Reddit。 我选择潜水潜水和远足潜水作为我感兴趣的两个主题,因为这两个主题都在同一主要社区“旅行”下,但又有足够的差异,因此应该有可能训练机器学习模型。 问题陈述 近年来,流浪汉变得越来越世俗,对冒险的渴望增加了。水肺潜水和远足是一项冒险运动,使我们能够探索水上和水下的世界。因此,对于需要在互联网人群中寻找冒险旅行者的旅行社而言。因此,通过
  3. 所属分类:其它

    • 发布日期:2021-03-19
    • 文件大小:2048
    • 提供者:weixin_42129005
  1. Predicting-the-popularity-of-Reddit-posts:给定一个Reddit帖子,我们希望通过收到的赞数来预测其受欢迎程度。帖子收到的投票数量会影响其在网站上的可见性。因此,重要的是要了解帖子功能对其受欢迎程度的

  2. 预测Reddit帖子的受欢迎程度 给定一个Reddit帖子,我们希望通过收到的赞数来预测其受欢迎程度。帖子收到的投票数量会影响其在网站上的可见性。因此,重要的是要了解帖子功能对其受欢迎程度的相对重要性。除了使用各种机器学习模型来发布元数据以外,我们还将利用诸如GloVe词嵌入和情感分类之类的NLP技术来解决此问题。
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:140288
    • 提供者:weixin_42162171
  1. reddit-nlp-源码

  2. reddit-nlp
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:30720
    • 提供者:weixin_42116596
  1. quote-me-ai:行情生成机器人-源码

  2. 引用我的AI Quote Me AI是生成报价的机器人,其唯一目的是生成唯一的报价。 生成的报价被绘制到图像上并发布到subreddit 。 样品 使用的图书馆 GPT-2-simple-文本生成 Unsplash API-照片搜索 spacy-NLP任务(词嵌入,相似性搜索) 船首-将报价图像发布到subreddit 工作流程图 如何使用 安装库pip install -r requirements.txt 将config_template.py重命名为config.py并填写未启动,
  3. 所属分类:其它

    • 发布日期:2021-03-15
    • 文件大小:49283072
    • 提供者:weixin_42160645
  1. 语言分类-源码

  2. 顶点:语言分类 卢克·赫林加 数据科学沉浸式遥控器(DSIR-113020) 2021年3月4日 问题陈述 执行摘要 该项目的范围旨在涵盖Web API的使用,自然语言处理(NLP)以及分类模型的比较。 首先,使用Pushshift reddit API从子Reddit r / Coffee和r / tea收集5000个帖子。 清洗后,将剩余的4607个帖子标题和相关的subreddit标签分为一个训练集(数据的75%)和一个测试集(数据的25%)。 然后对多种NLP技术和分类模型进行了测试,
  3. 所属分类:其它

    • 发布日期:2021-03-04
    • 文件大小:2097152
    • 提供者:weixin_42133680
  1. WSB帖子:对“华尔街赌注”上的帖子的分析-源码

  2. WSB帖子 :building_construction: 正在施工:construction: :building_construction: 《华尔街下注》帖子分析(此处的数据集: : )。 当前:编写快速的Spark管道以正确处理Reddit帖子。 下一步:Spark NLP中的主题建模。 之后:聚类,汇总,并将其映射到主题模型上?
  3. 所属分类:其它

    • 发布日期:2021-02-18
    • 文件大小:4194304
    • 提供者:weixin_42108778
  1. Reddit-Hate-Detection:该项目将Web爬网与NLP相结合,以检测,量化和分类Reddit社区上的仇恨言论-源码

  2. Reddit仇恨检测
  3. 所属分类:其它

    • 发布日期:2021-02-18
    • 文件大小:15360
    • 提供者:weixin_42134769
  1. 沙盒-源码

  2. 804-Coke Hackathon-Lasso回归模型,用于预测限时产品对类别销售的影响。 使用DataBricks汇总所有横幅上的POS数据,用于预测的线性回归模型以及对系数的分析,以为围绕品牌/口味的决策提供依据。 R ^ 2为90.34%。 823-使用Reddit News预测DJIA-预测明天DJIA收市价的上涨或下跌的分类问题。 使用NLP,功能工程和堆叠集成可在固定测试集​​上产生69%的精度。 与Hamza Munir合作 831-客户购买倾向-电子商务商店数据集的分类,用于
  3. 所属分类:其它

    • 发布日期:2021-02-15
    • 文件大小:5242880
    • 提供者:weixin_42132598
  1. NLP-snowboarding-vs-skiing:创建分类模型以区分两个subreddit通道滑雪和滑雪,并使用情感分析来比较两者-源码

  2. 伯顿滑雪板: 单板滑雪与滑雪:伯顿(Burton)是否应该进入滑雪市场? 问题陈述 伯顿滑雪板正在考虑进入滑雪市场。 为了弄清楚他们是否应该进入滑雪市场,伯顿滑雪板公司带我去了解与滑雪板相似的滑雪者。 我查看了有关滑雪者和滑雪者如何谈论各自运动的评论数据,以及他们对于在山上滑雪的看法,以了解是否可以像伯顿向滑雪者那样推销滑雪者。 执行摘要 为了弄清楚是否可以使用与Burton相似的方法来销售滑雪者,我研究了滑雪和滑雪的子项,以分析滑雪者和滑雪者的言论。 我使用pushshift API总共提取了
  3. 所属分类:其它

    • 发布日期:2021-02-14
    • 文件大小:6291456
    • 提供者:weixin_42137032
  1. Reddit-NLP-源码

  2. 项目3:Web API和NLP 问题陈述 通过使用带有不同矢量化器的各种模型,我想通过分析用户在不同子reddit中使用的词来确定模型是否可以准确预测用户的成熟度/年龄。 我将从每个subreddit,r /​​ Teenagers和r / Adulting收集5,000行数据,并使用这些数据来训练我的朴素贝叶斯和KNN模型。 我的目标是确定在两个子Reddit中的任何一个中使用的关键字,创建停用词,并确定模型中的最佳超参数。 使用的内容和数据 笔记本(按顺序) 数据采集 Adulting_D
  3. 所属分类:其它

    • 发布日期:2021-02-10
    • 文件大小:5242880
    • 提供者:weixin_42128015
  1. 广告牌:Bill 1950-2015年Billboard的Top 100歌词相关的NLP数据-源码

  2. 介绍 自1950年以来,我们的项目研究并可视化了流行歌曲的歌词和相关数据的演变方式。我们每年夺取Billboard上排名前100位的歌曲,并使用自然语言处理来分析各种指标。 用户可以交互地选择他们感兴趣的年份/类型范围,以更仔细地了解细微之处。 Lee Juhee Lee,Yinan Wen和联合项目 数据 检索/分析 广告牌前100首歌曲 我们唯一的初始数据集来自Billboard的前100名。我们从reddit的r / datasets中获取了1950年至2015年前100首歌曲的。 歌词
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:3145728
    • 提供者:weixin_42099814
  1. NLP情感:使用NLTK,Scikit-Learn和Keras对亚马逊产品评论进行情感分析。 使用超参数搜索和LSTM,我们最好的模型可达到约96%的精度-源码

  2. 亚马逊评论情绪分析 情感分析一直在增长-既由于深度学习中使用了新的分析技术,又因为到处都有大量的数据生成。 每条产品评论,每条推文,每条Reddit帖子等均包含我们希望能够处理和理解的主观信息。 例如,假设您是Netflix。 然后,您对客户对您的服务和电视节目/电影选择要说的话非常感兴趣,并且您可能会希望挖掘Facebook帖子和推文以及IMDB评论等,以评估公众意见。 如果您是一名政客,那么您(希望)对选民的想法,他们想要什么,他们持有哪些宝贵价值观等感兴趣,因此您可能会有一个团队来分析这
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:37888
    • 提供者:weixin_42117340
  1. subreddit-analyzer:全面的数据和文本挖掘工作流程,可处理来自任何给定公共subreddit的提交和评论-源码

  2. Subreddit分析器 该项目记录了使用Pushshift API下载大量Reddit提交和评论的过程,以获取有趣的见解,例如按工作日,小时和最常用词的分发方式。 该项目分为三个主要部分,即ETL过程,NLP管道以及图表和见解的生成。 以下是所包含脚本的摘要: subreddit_comments.py-一个Python脚本,可从Pushshift API下载固定数量的注释。 subreddit_submissions.py-一个Python脚本,可从Pushshift API下载固定
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:18874368
    • 提供者:weixin_42169674
  1. textacy:NLP,spaCy之前和之后-源码

  2. textacy:NLP,spaCy之前和之后 textacy是一个基于高性能spaCy库的Python库,用于执行各种自然语言处理(NLP)任务。 通过将基础知识-令牌化,词性标记,依赖项解析等-委托给另一个库, textacy主要关注于之前和之后的任务。 产品特点 通过用于处理一个或多个文档的便捷方法访问spaCy,并通过自定义扩展名和自动语言识别扩展其功能,从而为文本应用正确的spaCy管道 下载包含文本内容和元数据的数据集,从国会演讲到历史文献再到Reddit评论 轻松以多种常用格式在磁盘
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:319488
    • 提供者:weixin_42099176