您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. PLAsTiCC-Kaggle-Classification-源码

  2. PLAsTiCC-Kaggle分类 该存储库的此目录包含2018年PLAsTiCC LSST数据分类竞赛使用的代码(从未提交分数)。 这也将用作Drexel大学物理系提供的大数据课程最终项目的提交材料。 该项目涉及对天文资源进行分类。 有时间序列数据以及与时间无关的数据。 分类所采用的策略是计算时间序列数据的特征(平均值,标准偏差等)。 然后,将时间序列特征和时间独立数据的组合使用用于训练每个单独类别的逻辑回归模型。 比赛训练集的80%用于训练,而20%用于测试。 对于测试,测试集中的每个模型
  3. 所属分类:其它

    • 发布日期:2021-03-25
    • 文件大小:9216
    • 提供者:weixin_42151772
  1. DS-Unit-1-Sprint-5-Data-Storytelling-Blog-Post-源码

  2. DS Data Storytelling投资组合项目 内容 可交付成果 该项目分为五个部分。 对于每个部分,我们都列出了通过Sprint挑战赛所需的条件,以及建议但不要求的条件。 1.博客文章 必需的 选择您自己的主题和数据。 用至少两个数据可视化编写博客文章,以交流有关您的主题的见解。 在中型网站或投资组合网站上发布您的帖子。 不要使用来自Kaggle比赛的数据或流行的“玩具”数据集。 推荐的 不要写 将您的帖子格式化为可。 编辑它以使其。 描述您的见解和过程,但更多地关注见解。 在
  3. 所属分类:其它

    • 发布日期:2021-03-17
    • 文件大小:4096
    • 提供者:weixin_42135753
  1. Causal-Inference-Project-源码

  2. 因果推理项目 Uri Shalit博士和Rom Gutman先生在此存储了我们的“因果推理简介”课程项目。 在这个项目中,我们试图确定在足球比赛的前半段持球对比赛后半段的目标射门次数的影响。 数据 数据主要来自两个kaggle数据集: 欧洲足球数据库: : 补充数据库: : 文件 这些是我们使用的代码文件: “ EDA.ipynb”:在开始从事该项目之前,我们使用此笔记本来了解数据集。 dataset_creation.ipynb :我们使用此笔记本从原始数据集中创建了所需的文件
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:15728640
    • 提供者:weixin_42098251
  1. kaggle:Kaggle比赛代码-源码

  2. kaggle:Kaggle比赛代码
  3. 所属分类:其它

    • 发布日期:2021-03-09
    • 文件大小:34816
    • 提供者:weixin_42113456
  1. 去噪变压器自动编码器-源码

  2. 降噪变压器自动编码器 此回购保存了我对Kaggle竞赛解决方案中的降噪自动编码器部分。 我的大部分工作都花在了训练降噪自动编码器网络上,以捕获输入之间的关系,并将学习到的表示形式用于下游监督模型。 复制单个模型 获取代码并移至代码目录。 按照指定安装python软件包。 下载比赛数据并修改的路径。 在单个GPU机器上运行python train.py并等待大约20个小时。 通过岭回归,其交叉验证的RMSE得分应为0.8412。 关于网络 该网络是一个AutoEncoder网络,中间层是
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:185344
    • 提供者:weixin_42153615
  1. Kaggel-Tabular-Playground-Series-2021:我对2021年Kaggle表格游乐场比赛的参与代码-源码

  2. Kaggel-Tabular-Playground-Series-2021:我对2021年Kaggle表格游乐场比赛的参与代码
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:245366784
    • 提供者:weixin_42099814
  1. 国际足球数据项目:DataScience训练营项目1-源码

  2. 国际足球成绩探索数据分析 分组项目以探索任何感兴趣的数据集。 我们的团队选择了在kaggle上找到的国际足球比赛结果数据集: ://www.kaggle.com/martj42/international-football-results-from-1872-to-2017我们的目标是从数据中创建3个有趣的视觉效果。 我们希望通过热图可视化比赛中的位置,描述一段时间内每场比赛的平均进球,并找出过去100多年来获胜最多的国家/地区。 入门 您将需要自己的Google api密钥来运行这些文件,但
  3. 所属分类:其它

    • 发布日期:2021-02-22
    • 文件大小:8388608
    • 提供者:weixin_42112894
  1. rgf:正则化贪婪森林(RGF)库的主存储库。 它包括本文的原始实现和用C ++编写的多线程代码,以及各种特定于语言的包装器-源码

  2. 正规贪婪森林 正规贪婪森林(RGF)是描述的一种树群机器学习方法。 在许多数据集上,RGF可以提供比梯度增强决策树(GBDT)更好的结果,它已被用来赢得一些Kaggle比赛。 与传统的增强决策树方法不同,RGF直接与基础森林结构配合使用。 RGF整合了两种思想:一种是将树形结构的正则化纳入学习公式; 另一种是采用完全校正的正则化贪婪算法。 该存储库包含RGF算法的以下实现: :本文的原始实现; :具有一些简化的多核实现; :Python的RGF和FastRGF实现的包装; :Rg
  3. 所属分类:其它

    • 发布日期:2021-02-20
    • 文件大小:3145728
    • 提供者:weixin_42140846
  1. 带有词嵌入的情感分析-源码

  2. 带有词嵌入的情感分析 喀拉拉邦人的情感分析模型可在线分析有毒评论。 语料库使用手套词嵌入进行预处理。 数据 : 以下代码中使用的语料库摘自Kaggle竞争“有毒评论分类”。 它由Wikipedia的谈话页面编辑中的在线评论组成。主要任务是将评论分为有毒,严重有毒,*,威胁,侮辱和身份仇恨等不同类别。比赛链接为 (截止日期在我开始进行情感分析之前已经结束,因此无法提交我的结果) 词嵌入: 众所周知,语料库是原始文本,因此需要先进行预处理,然后再提供给我们的模型。 我使用Glove预训练的单词
  3. 所属分类:其它

    • 发布日期:2021-02-19
    • 文件大小:136192
    • 提供者:weixin_42125867
  1. Feb_2021_Tabular_Playground-源码

  2. 这是我在2021年2月的Kaggle表格游乐场比赛中的代码。 可以在以下位置找到数据集: : 。
  3. 所属分类:其它

    • 发布日期:2021-02-18
    • 文件大小:138412032
    • 提供者:weixin_42132056
  1. 机器学习代码:与机器学习问题相关的代码-源码

  2. 机器学习代码 在过去的三年中,我自己通过一些书籍,在线课程,视频,对话和整个互联网来学习机器学习。 收集了合理的知识后,我开始参加一些Kaggle的比赛。 还有很多东西要学习,但是与此同时,我想与您分享我的一小部分机器学习经验。 我希望它是有用的。 以下阅读资料对我的机器学习世界之旅非常有帮助。 Python数据科学手册:使用数据的基本工具。 作者:J. VanderPlas 模式识别和机器学习。 作者:克里斯托弗·毕晓普(Christopher Bishop)的书信息论,推理和学习算法。
  3. 所属分类:其它

    • 发布日期:2021-02-17
    • 文件大小:9437184
    • 提供者:weixin_42130862
  1. 泰坦尼克号:您必须要做的必不可少的泰坦尼克项目,然后他们才能称呼您为数据科学家-源码

  2. 在这里,这是您必须要做的必不可少的“泰坦尼克计划”,任何人都可以合法地将您称为数据科学家。 说真的,我很想参加一场kaggle比赛 项目概况: 在测试装置上达到了77.51%的准确性。 很难知道排行榜有多好,因为排行榜上充满了100%准确率的人。 我必须假设他们获得如此高分的方法是...让我们说这是非常规的。 数据是从正在进行的kaggle比赛中获取的 广泛的EDA和功能工程。 使用Logistic回归,梯度提升和支持向量聚类。 使用GridSearchCV和RandomizedSea
  3. 所属分类:其它

    • 发布日期:2021-02-14
    • 文件大小:618496
    • 提供者:weixin_42126677
  1. 比赛3395-源码

  2. 比赛3395 法语能力竞赛竞赛者竞赛者: ://www.kaggle.com/c/ift3395-6390-arxiv 多项式的代码bayesV3.py和实施的算法。 在Kaggle Pour lancer cce代码(简单执行者)上获得0.79777分类评分的Cette算法许可。 Ilcréeraalors un ficchier solution.csv竞争性分类测试。 tensorflow_code.py的内容,包含伪神经元Tensorflow。 信誉良好的分类法,简单分类的评分为
  3. 所属分类:其它

    • 发布日期:2021-02-11
    • 文件大小:12582912
    • 提供者:weixin_42174176
  1. conway-reversed:Kaggle的Conway的2020年反向人生游戏挑战赛的第三名-源码

  2. Kaggle:Conway 2020逆向生活游戏第三名(部分) 我和Itauka Kota一起比赛。 该存储库仅包含我的方法的代码。 方法 给定终生游戏end state ,任务是找到有效的start state ,该end state在delta步长后演变为所需的end state 。 该方法有两个主要组成部分: BestGuess,一个神经网络,可以预测单个步骤的开始状态。 重复的delta大于1。 其次是优化程序 最佳的揣测 神经网络一次只能预测一个细胞,因为有许多可能的sta
  3. 所属分类:其它

    • 发布日期:2021-02-11
    • 文件大小:165888
    • 提供者:weixin_42104906
  1. kaggle-for-fun:我曾经参加过的Kaggle竞赛的所有参赛作品-源码

  2. 有趣的卡格勒 我参加和即将参加的Kaggle比赛的所有参赛作品。 我可能会用Python(利用scikit-learn或类似的库)编写所有内容,但是如果可以的话,偶尔我也可能会使用R或Haskell。 因为我认为这是我的游乐场,所以在此存储库中编写的代码可能非常草率。 如果您有兴趣,请随时做出贡献。 avazu-ctr预测 Avazu的CTR预测比赛- 我的解决方案利用GradientBoostingClassifier和一些预处理/工程流程功能。 就对数损失而言,它的得分为0.40
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:18874368
    • 提供者:weixin_42099116
  1. kaggle-code:我在kaggle数据科学和机器学习任务中使用的一些代码的存储库-源码

  2. 凸轮的Kaggle密码 该存储库包含我在Kaggle数据科学/机器学习任务中使用的一些代码。 如果适用,我将一次比赛中的所有代码/数据保存在一个文件夹中。 也就是说,“ california_housing”将包含“加利福尼亚住房”数据集以及与该数据一起使用的所有内核或代码。 为了避免批量复制,我没有所有数据集的副本,因此某些脚本在主文件夹中单独存在。 要使用这些文件,您可以转到Kaggle并下载相关数据的副本。
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:53477376
    • 提供者:weixin_42171208
  1. Erlemar.github.io:数据科学组合-源码

  2. 数据科学组合Andrey Lukyanenko 该产品组合是我为数据分析或探索机器学习算法而创建的笔记本的汇编。 单独的类别用于单独的项目。 独立项目。 手写数字识别 这是我自己在实践中使用图像识别方法的项目。 这是一个网站(也适用于移动设备),用户可以在其中绘制数字,并且机器学习模型(FNN和CNN)将尝试识别该数字。 之后,模型可以使用绘制的数字进行训练以提高其准确性。 现场版在。 该代码可以在找到。 电报中的聊天机器人 一种对话聊天机器人,是荣誉荣誉授课而创建的。 该机器人的主要功能是区
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:3145728
    • 提供者:weixin_42181545
  1. kaggle-quora-dup:Kaggle的Quora重复问题检测竞赛的解决方案-源码

  2. Kaggle的Quora重复问题检测比赛的解决方案 可以通过以下链接找到比赛: ://www.kaggle.com/c/quora-question-pairs使用该解决方案,我在3307个团队中排名第23(最高1%)。 考虑到其他顶级解决方案,这是一个相对轻量级的模型。 先决条件 从下载预训练的单词向量,即Gloves.840B.300d,并将其放入项目目录。 从下载火车和测试数据。 创建一个名为“数据”的文件夹并将其放入。 将所有软件包安装在requirements.txt中。 管道
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:64512
    • 提供者:weixin_42134143
  1. open-solution-toxic-comments:有毒评论分类挑战的开放式解决方案-源码

  2. 入门代码:Kaggle 更多比赛 :sparkler: 检查收集 ,您可以在其中找到具有代码,实验和输出的多个Kaggle竞赛。 在这里,在我们喜欢参加Kaggle比赛。 特别有趣,因为它涉及在线骚扰的重要问题。 将我们的预测整合到云端! 您需要注册到neptune.ml才能使用我们对整体模型的预测。 点击start notebook 选择browse按钮 从该存储库中选择neptune_ensembling.ipynb文件。 选择工作程序类型:建议使用gcp-large 。 运
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:798720
    • 提供者:weixin_42098104
  1. kaggle-CrowdFlower:在Kaggle上CrowdFlower产品搜索结果相关性竞赛的第一名解决方案-源码

  2. Kaggle_CrowdFlower 第一名的解决方案 我们在比赛中获得的最佳单一模型是模型,其中公共LB得分为0.69322 ,私人LB得分为0.70768 。 我们最终的获奖作品是35个最佳公共LB作品的中位数合计。 该提交关于私人LB的得分0.70807公共LB和0.72189 什么是新的 2016/05/14:有关此代码和框架的更干净,模块化的版本,您可能需要查看 ,其中包含针对最近进行的的Turing Test解决方案的代码。 流程图 文献资料 有关文档,请参见./Doc/Kaggl
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:5242880
    • 提供者:weixin_42104366
« 12 »