文件名称:
DuplicateQuestionPairs:预测在线论坛中的两个问题是否重复。 然后比较几种分类算法以找到最佳模型-源码
开发工具:
文件大小: 54kb
下载次数: 0
上传时间: 2021-02-21
详细说明:Udacity_MachineLearningEngineer_Capstone
Udacity的机器学习纳米学位的Capstone项目
介绍
Quora是一个受欢迎的网站,人们可以在其中提问和回答各种问题。 但是,很多时候人们会遇到相似或几乎相同的问题,这使得寻找最佳答案变得困难。 在这个项目中,我开发了一种监督学习算法来检测Quora上的重复问题。
所需库
麻木
大熊猫
词云
斯克莱恩
matplotlib
操作系统
馆藏
xgboost
Graphviz
跑步
所有运行脚本都在capstone.ipynb文件中。
数据
培训数据和测试数据均可在。 它们太大,无法存储在此存储库中。
最后结果
使用具有6个功能的XGboost模型,我的对数损失约为0.39。
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.