您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. PySpark-ML-源码

  2. PySpark-ML 在此存储库中,将演示使用PySpark的多类文本分类的Python编程语言编写Spark的功能。 数据结构 df = spark . read . csv ( '/home/renos/Downloads/sf-crime/train.csv' , header = True , inferSchema = True ) print ( df . columns ) print ( len ( df . columns )) ['Dates', 'Category',
  3. 所属分类:其它

    • 发布日期:2021-03-17
    • 文件大小:39936
    • 提供者:weixin_42168230
  1. dsc-4-39-06-building-recommendation-system-als-pyspark-seattle-ds-career-040119-源码

  2. 在PySpark中构建推荐系统-实验室 介绍 在最后一个实验中,我们将在Spark编程环境中使用ALS实现一个电影推荐系统。 Spark的机器学习libraray ml随附了非常有效的ALS算法,我们在上一课中已经介绍了该算法。 该实验室将要求您实践一下用于创建和操作pyspark DataFrame的Spark编程技能。 我们将通过逐步的过程逐步发展出使用ALS和pyspark的电影推荐系统,并使用我们在之前的实验中使用的MovieLens数据集。 注意:建议您为完成本实验而大量参考,因为它
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:870400
    • 提供者:weixin_42127783
  1. Apache-pyspark-hadoop-using-databricks:说明使用pyspark执行的一些基本活动,并使用MLlib API执行一些机器学习(ML)算法-源码

  2. Apache-pyspark-hadoop使用数据块 说明使用pyspark执行的一些基本活动,并使用MLlib API执行一些机器学习(ML)算法 发布在此存储库上的笔记本是使用databricks开发的,databricks是spark创始人创建的一个开源平台,您可以选择以下提到的其他平台: 1)在虚拟机/本地机上使用ubuntu(或) 2)AWS EC2(或) 3)AWS EMR(或) 4)数据砖。 为了使用数据砖在此github存储库中执行笔记本,请创建一个社区版帐户,然后开始
  3. 所属分类:其它

    • 发布日期:2021-03-07
    • 文件大小:81920
    • 提供者:weixin_42131405
  1. 5机器学习与火花ML-源码

  2. 5机器学习与火花ML 1.介绍Spark.ML ALS(交替最小二乘)。 1ºImportamos todas lalibreríasyademásesta nueva from pyspark . ml . recommendation import ALS 2ºCreamosfunciónpara cargar los datos,y la sesion de spark def loadMovieNames (): movieNames = {} # CHAN
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:1011712
    • 提供者:weixin_42125867
  1. Pyspark的波士顿住房价格:Pyspark线性回归的波士顿住房价格-源码

  2. 波士顿房屋价格与Pyspark 使用PySpark和MLlib建立波士顿房价预测的线性回归 Apache Spark已成为机器学习和数据科学中最常用和受支持的开源工具之一。 该项目是使用Apache Spark的spark.ml线性回归预测波士顿房价的温和介绍。 目标是提出一个模型来预测该地区给定房屋的中位数。 数据源 我们的数据来自Kaggle竞赛:波士顿郊区的房屋价值。 链接: :
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:299008
    • 提供者:weixin_42101237
  1. 频谱化:Insight DE项目-音频处理平台-源码

  2. 解压缩音频文件以快速进行ML探索 目录 概述 音频数据在现代世界中无处不在,并且对各种各样的行业和应用具有很高的价值。 许多公司依靠将机器学习算法应用于各种音频数据集而获得的见解。 尽管许多此类应用程序基于已定义的摘要统计信息,但较新的深度学习方法依赖于处理尽可能多的数据特征。 Spectralize是一个平台,旨在将常见音频文件处理和解压缩为完全索引的频谱特征,从而可以快速用于分析和ML探索。 工程设计 处理管道 Spectralize基于Python,实现Spark数据帧,并将数据从AWS
  3. 所属分类:其它

    • 发布日期:2021-02-14
    • 文件大小:359424
    • 提供者:weixin_42160645
  1. H1B_LCA_outcome_prediction:预测是否批准或拒绝H1B申请人的劳动条件申请-源码

  2. 项目摘要- 储存库内容- 项目报告-/reports/project_report.pdf 源代码-/ src / 参考书目和参考-/references/references.html 技术文档-/ doc / 训练有素的模型-/ models / 工具和技术- 数据分析-Python ML管道-PySpark(库:MLlib) 可视化-Altair,Streamlit CI / CD-詹金斯 IDE-Gitpod(VSCode) 原型制作-Google Colab 部署
  3. 所属分类:其它

    • 发布日期:2021-02-10
    • 文件大小:1048576
    • 提供者:weixin_42148053
  1. Optimus:使用dask,cudf,dask_cudf和pyspark简化了敏捷数据准备工作流程-源码

  2. 要启动实时笔记本服务器以使用活页夹或Colab测试擎天柱,请单击以下标记之一: Optimus是缺少使用Apache Spark(PySpark)以分布式方式进行概要分析,清理,处理和执行ML的框架。 安装(点): 在您的终端中,键入pip install optimuspyspark 要求 Apache Spark> = 2.4.0 Python> = 3.6 例子 您可以转到Optimus 十分钟,在那里您可以找到开始工作的基本方法。 您也可以转到文件夹找到有关数据清理,
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:20971520
    • 提供者:weixin_42128393
  1. petastorm:Petastorm库可对Apache Parquet格式的数据集进行单机或分布式培训以及对深度学习模型的评估。 它支持Tensorflow,Pytorch和PySpark等ML框架,并且可以从纯Python代码中使用-源

  2. petastorm:Petastorm库可对Apache Parquet格式的数据集进行单机或分布式培训以及对深度学习模型的评估。 它支持Tensorflow,Pytorch和PySpark等ML框架,并且可以从纯Python代码中使用
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:3145728
    • 提供者:weixin_42116701