您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. XGBoost导读和实战--原理解析及源码、实战指导

  2. Scalable, Portable and Distributed Gradient Boosting (GBDT, GBRT or GBM) Library, for Python, R, Java, Scala, C++ and more. Runs on single machine, Hadoop, Spark, Flink and DataFlow 可扩展、移植、分布式的Gradient Boosting (GBDT, GBRT or GBM)库,适用于Python, R, Jav
  3. 所属分类:机器学习

    • 发布日期:2018-06-24
    • 文件大小:894976
    • 提供者:wustjk124
  1. python机器学习库xgboost的使用

  2. 主要介绍了python机器学习库xgboost的使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
  3. 所属分类:其它

    • 发布日期:2020-09-18
    • 文件大小:125952
    • 提供者:weixin_38698018
  1. imldiff:使用可解释机器学习解释分类器之间的差异-源码

  2. 使用可解释机器学习解释分类器之间的差异 要求 Python 3.9环境 软件包shap需要在Mac上使用llvm版本8、9或10,并使用以下命令安装: brew install llvm9 && echo 'export PATH="/usr/local/opt/llvm9/bin:$PATH"' >> ~/.zshrc 软件包xgboost需要Mac上的LLVM的OpenMP运行时库,安装方式为: brew install libomp 安装 pip install -r req
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:30408704
    • 提供者:weixin_42126399
  1. YiQi-ZombieCompanyClassifier:易企|僵尸企业分类系统2020年第十一届中国大学生服务外包创新创业大赛A09赛题-僵尸企业画像及分类决策树,随机森林与XGBoost投票投票支持Web端访问Bootstrap + D

  2. 易企|僵尸企业分类系统 该项目是2020年第十一届中国大学生服务外包创新创业大赛A09赛题-僵尸企业画像及分类我们团队提交作品的源码。该项目主要任务是要根据给定的企业信息,进行二分类,判断是僵尸企业和非僵尸企业。 本项目分为两部分,第一部分是机器学习训练模型,业务与统计两个角度构造特征,使用RFECV作特征筛选,算法主要使用决策树,随机森林与XGBoost,网格搜索五折交叉参数调优,并使用投票分类器融合,权重使用遗传算法确定,并造成数据融合。第二部分是Web可视化界面,用于支持拆分和批量企业信息
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:6291456
    • 提供者:weixin_42132359
  1. capstone-project-for-arvato-financial-service-源码

  2. 人工金融服务的顶点项目(Udacity-数据科学纳米学位) 描述 该项目包括三个主要步骤:客户细分报告,监督学习模型和Kaggle竞赛。 客户细分报告使用无监督学习方法来分析已建立客户和一般人群的属性,以创建客户细分。 监督学习模型构建一个机器学习模型,该模型使用MAILOUT TRAIN数据集作为验证数据集来预测每个人是否将对活动做出响应。 Kaggle竞赛作为Kaggle竞赛的一部分,将使用训练有素的模型对MAILOUT TEST进行预测(个人成为邮寄活动客户的概率)。 依存关系 该存
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:890880
    • 提供者:weixin_42157567
  1. Data_Science_work:这是我在探索该领域时完成的一组数据科学项目-源码

  2. 统计,数据科学,AI和ML 创建该存储库是为了存储我与数据科学领域相关的项目,笔记和学习内容。 它包括使用各种数据科学和机器学习技术执行的项目。 我使用了来自各种开源数据存储库的数据集。 范围:这项工作主要围绕使用各种支持库在python环境中执行这些最新技术进行。 它不涉及算法背后的密集数学。 但是,我在某些笔记本中附加了各种资源链接,以便从概述的角度更好地理解它们。 我坚信,在尝试理解或使用这些笔记本之前,必须对这些技术和背后的算法有充分的了解。 内容 探索性数据分析 机器学习 监督学习
  3. 所属分类:其它

    • 发布日期:2021-02-26
    • 文件大小:3145728
    • 提供者:weixin_42110038
  1. awesome-r:精选的R框架,库和软件的精选清单-源码

  2. 真棒 精选的R框架,库和软件的精选清单。 -R中图形语法的实现 R软件包,框架和软件的列表。 使用R轻松实现交互式Web应用程序 -dplyr:数据处理语法 :graduation_cap: 漩涡S软件包的交互式课程的集合。 使用R进行异常检测 数据科学R:一本书 使用R Markdown编写书籍和技术文档 R开发人员生活的工具 -R的动态文档 -R中动态报告生成的通用工具 -R的交互式图形库 关于二进制分类(随机)的顶级机器学习算法的常用开源实现(R包,Python sci
  3. 所属分类:其它

    • 发布日期:2021-02-11
    • 文件大小:39936
    • 提供者:weixin_42148053
  1. benchm-ml:用于二进制分类的顶级机器学习算法(随机森林,Rus,Python scikit-learn,H2O,xgboost,Spark MLlib等)的可扩展性,速度和准确性的最低基准。梯度增强树,深度神经网络等)-源码

  2. 用于分类的机器学习库的可伸缩性,速度和准确性的简单/有限/不完整基准 所有基准都是错误的,但有些是有用的 该项目旨在为一些机器学习算法的常用实现的可伸缩性,速度和准确性提供一个最低基准。 这项研究的目标是使用数字和分类输入(具有有限的基数,即不是很稀疏)并且没有丢失的数据进行二进制分类,这可能是业务应用程序中最常见的问题(例如,信用评分,欺诈检测或客户流失预测)。 如果输入矩阵的大小为n x p ,则n的变化范围为10K,100K,1M,10M,而p为〜1K(在将分类扩展为伪变量/一次编码后)。
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:313344
    • 提供者:weixin_42134537
  1. starboost:逐步加强类固醇-源码

  2. 如果您正在寻找文档,请! 这是什么? 这是StarBoost,一个实现渐变增强的Python库。 梯度提升是一种用于监督学习的高效且流行的机器学习算法。 scikit-learn是否已经做到了? 确实scikit-learn ,但是唯一受支持的弱学习者是决策树。 本质上,梯度增强可以与决策树以外的其他弱学习者一起使用。 XGBoost / LightGBM / CatBoost呢? 提到的库是梯度增强决策树(GBRT)的最新技术。 他们实现了针对决策树量身定制的特定版本的梯度增强。
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:31744
    • 提供者:weixin_42116701
  1. NYTaxi_XG_Boost_Challenge-kaggle_challenge:我正在尝试NYC出租车持续时间预测Kaggle挑战。 我将结合使用Pandas,Matplotlib和XGBoost作为python库,以帮助我理解和分析

  2. Nyc-Taxi-Kaggle-挑战 目标 Kaggle竞赛预测纽约出租车的行驶时间。 该项目的报告在capstone.pdf。 (在这个项目中,我提供了许多链接,如果您是初学者,可以通过这些链接来弄清楚您的概念,如果不理解的话,可以通过project和readme中提供的链接和pdf来了解。) 问题陈述 在本报告中,我们使用来自纽约市出租车和高级轿车委员会的数据来考察Kaggle竞赛,该竞赛要求竞争对手预测纽约市出租车旅行的总行驶时间(trip_duration)。 Kaggle提供的数据是作
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:24117248
    • 提供者:weixin_42151305
  1. h2o-3:H2O是一个开源,分布式,快速且可扩展的机器学习平台:深度学习,梯度提升(GBM)和XGBoost,随机森林,广义线性建模(带有弹性网的GLM),K均值,PCA,广义附加模型(GAM),RuleFit,支持向量机(SVM),堆叠

  2. 水 H2O是用于分布式,可扩展的机器学习的内存平台。 H2O使用熟悉的界面(例如R,Python,Scala,Java,JSON和Flow笔记本/网络界面),并与Hadoop和Spark等大数据技术无缝协作。 H2O提供了许多流行实现,例如广义线性模型(GLM),梯度提升机(包括XGBoost),随机森林,深层神经网络,堆叠体,朴素贝叶斯,广义加性模型(GAM),考克斯比例危害,K-表示PCA,Word2Vec以及全自动机器学习算法( )。 H2O是可扩展的,因此开发人员可以添加自己选择的
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:92274688
    • 提供者:weixin_42126668
  1. xgboost:可扩展的,可移植的和分布式的梯度提升(GBDT,GBRT或GBM)库,适用于Python,R,Java,Scala,C ++等。 在单机,Hadoop,Spark,Dask,Flink和DataFlow上运行-源码

  2. 极限梯度提升 | | | | XGBoost是经过优化的分布式梯度增强库,旨在高效,灵活且可移植。 它在框架下实现了机器学习算法。 XGBoost提供了并行树增强(也称为GBDT,GBM),可以快速准确地解决许多数据科学问题。 相同的代码在主要的分布式环境(Kubernetes,Hadoop,SGE,MPI,Dask)上运行,并且可以解决数十亿个示例之外的问题。 执照 :copyright:Contributors,2019年。根据许可进行许可。 贡献给XGBoost XGBoost已由一
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:1048576
    • 提供者:weixin_42116672
  1. lale:半自动数据科学图书馆-源码

  2. le 使用其他语言的自述文件:, , 或您自己的语言。 Lale是用于半自动化数据科学的Python库。 通过Lale,可以轻松以类型安全的方式自动选择算法并调整与兼容的管道的超参数。 如果您是想要尝试自动化机器学习的数据科学家,那么此库适合您! 除了在scikit-learn之外,Lale还从三个方面增加了价值:自动化,正确性检查和互操作性。 对于自动化,Lale为现有管道搜索工具(包括Hyperopt,GridSearchCV和SMAC)提供了一致的高级界面。 为了进行正确性检查
  3. 所属分类:其它

    • 发布日期:2021-02-02
    • 文件大小:17825792
    • 提供者:weixin_42168830
  1. python机器学习库xgboost的使用

  2. 1.数据读取 利用原生xgboost库读取libsvm数据 import xgboost as xgb data = xgb.DMatrix(libsvm文件) 使用sklearn读取libsvm数据 from sklearn.datasets import load_svmlight_file X_train,y_train = load_svmlight_file(libsvm文件) 使用pandas读取完数据后在转化为标准形式 2.模型训练过程 1.未调参基线模型
  3. 所属分类:其它

    • 发布日期:2021-01-21
    • 文件大小:125952
    • 提供者:weixin_38752897