您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. R的极客理想-工具篇

  2. 本书首先介绍了R的工具包、时间序列包和性能监控包,然后阐述R语言与其他编程语言的通信以及R语言作为服务器的应用,最后阐释R语言与各种数据库的通信以及R语言与Hadoop集成。附录介绍了Java、Hadoop以及各种数据库对安装方式。书中内容涉及计算机、互联网、数据库、大数据、统计、金融等领域,详细总结了R语言与Java、MySQL、Redis、MongoDB、Cassandra、Hadoop、Hive、Hbase等技术的综合运用的解决方案,具有实战性,可操作性强。本书适合所有R语言工作者,包括
  3. 所属分类:金融

    • 发布日期:2014-10-19
    • 文件大小:4194304
    • 提供者:talent2g
  1. SpagoBI hadoop集成

  2. SpagoBI集成 hadoop应用集成 hive应用集成 hadoop前端呈现集成
  3. 所属分类:其它

    • 发布日期:2015-08-13
    • 文件大小:1048576
    • 提供者:xjcuiok
  1. Spark快速数据处理

  2. Spark是一个通用的并行分布式计算框架,由UCBerkeley的AMP实验室开发。Spark使得程序员更容易地编写分布式应用,并且能够根据自己的喜好使用Scala、Java或者Python作为开发语言。本书系统讲解了Spark的应用方法,包括如下内容:第1章介绍如何在多种机器上安装Spark,以及如何配置一个Spark集群。第2章介绍如何在交互模式下运行第一个Spark作业。第3章介绍如何在Spark集群上构建一个生产级的脱机\独立作业。第4章介绍如何与Spark集群建立连接,以及Spark
  3. 所属分类:其它

    • 发布日期:2015-08-31
    • 文件大小:24117248
    • 提供者:hx0_0_8
  1. 大数据学习笔记

  2. 第一部分 Spark学习 6 第1章 Spark介绍 7 1.1 Spark简介与发展 7 1.2 Spark特点 7 1.3 Spark与Hadoop集成 7 1.4 Spark组件 8 第2章 Spark弹性分布数据集 9 2.1 弹性分布式数据集 9 2.2 MapReduce数据分享效率低 9 2.3 MapReduce进行迭代操作 9 2.4 MapReduce进行交互操作 10 2.5 Spark RDD数据分享 10 2.6 Spark RDD 迭代操作 10 2.7 Spark
  3. 所属分类:其它

    • 发布日期:2016-10-31
    • 文件大小:5242880
    • 提供者:henni_719
  1. 大数据学习笔记.pdf

  2. 目录 第一部分 Spark学习 ....................................................................................................................... 6 第1章 Spark介绍 ...................................................................................................
  3. 所属分类:其它

    • 发布日期:2016-11-03
    • 文件大小:6291456
    • 提供者:henni_719
  1. Spark 2.0.2 Spark 2.2 中文文档

  2. 本资源为网页,不是PDF Apache Spark 2.0.2 中文文档 Spark 概述 编程指南 快速入门 Spark 编程指南 概述 Spark 依赖 Spark 的初始化 Shell 的使用 弹性分布式数据集(RDDS) 并行集合 外部数据集 RDD 操作 RDD 持久化 共享变量 Broadcast Variables (广播变量) Accumulators (累加器) 部署应用到集群中 使用 Java / Scala 运行 spark Jobs 单元测试 Spark 1.0 版本前
  3. 所属分类:spark

    • 发布日期:2017-12-07
    • 文件大小:62
    • 提供者:huoyongjie698
  1. hue-3.9.0-cdh5.12.1.tar.gz

  2. HUE是一个开源的图形用户界面,用于操作和开发用于执行自助服务数据分析的应用程序。 集成管理各类大数据应用程序,如:hadoop、hive、hbase、spark等
  3. 所属分类:Hadoop

    • 发布日期:2018-05-22
    • 文件大小:121634816
    • 提供者:sl285720967
  1. 2017最新大数据架构师精英课程

  2. 本资源为大数据基础到中高级教学资源,适合稍微有点大数据或者java基础的人群学习,资源过大,上传乃是下载链接,不多说,上目录: 1_java基础2 l3 a2 a$ t7 J2 b+ `- p 2_java引入ide-eclipse 3_java基础知识-循环-类型转换 4_循环-函数-数组-重载 5_多为数组-冒泡-折半-选择排序 6_oop-封装-继承-static-final-private 7_多态-接口-异常体系 8_适配器/ k% N! Y7 j/ |- c) O5 M' V6 S
  3. 所属分类:Java

  1. R的极客理想 工具篇+高级开发篇+量化投资篇.zip

  2. 首先介绍了R的工具包、时间序列包和性能监控包,然后阐述R语言与其他编程语言的通信以及R语言作为服务器的应用,最后阐释R语言与各种数据库的通信以及R语言与Hadoop集成。附录介绍了Java、Hadoop以及各种数据库对安装方式。书中内容涉及计算机、互联网、数据库、大数据、统计、金融等领域,详细总结了R语言与Java、MySQL、Redis、MongoDB、Cassandra、Hadoop、Hive、Hbase等技术的综合运用的解决方案,具有实战性,可操作性强。
  3. 所属分类:其它

    • 发布日期:2019-05-22
    • 文件大小:162529280
    • 提供者:yeishu520
  1. 全栈数据之门.rar

  2. 全栈数据很好的入门书籍,高清带书签。以数据分析领域最热的Python语言为主要线索,介绍了数据分析库numpy、Pandas与机器学习库scikit-learn,使用了可视化环境Orange 3来理解算法的一些细节。对于机器学习,既有常用算法kNN与Kmeans的应用,决策树与随机森林的实战,还涉及常用特征工程与深度学习中的自动编程器。在大数据Hadoop与Hive环境的基础之上,使用Spark的ML/MLlib库集成了前面的各部分内容,让分布式机器学习更容易。大量的工具与技能实战的介绍将各部
  3. 所属分类:spark

    • 发布日期:2019-06-21
    • 文件大小:16777216
    • 提供者:weixin_45289854
  1. Airflow使用指南【About云整理】.pdf

  2. About云整理的Airflow使用指南 1. 如何安装和配置 Airflow? 2. 如何通过 Airflow UI 监控 data pipeline (管道)并对其进行故障排除 3. 什么是 Airflow Platform ? 4. Airflow 是如何进行数据分析,追踪数据,调试数据流的? 5. Airflow 命令行接口的基本操作有哪些?www.aboutyun.com活到老学到老 以下是一些将触发一些任务实例的命令。在运行以下命令时,您应该能够在 example bash
  3. 所属分类:Hadoop

    • 发布日期:2019-06-30
    • 文件大小:2097152
    • 提供者:bj278595437
  1. SparkSql使用入门

  2. Spark SQL是spark套件中一个模板,它将数据的计算任务通过SQL的形式转换成了RDD的计算,类似于Hive通过SQL的形式将数据的计算任务转换成了MapReduce。 Spark SQL的特点: 1、和Spark Core的无缝集成,可以在写整个RDD应用的时候,配置Spark SQL来完成逻辑实现。 2、统一的数据访问方式,Spark SQL提供标准化的SQL查询。 3、Hive的继承,Spark SQL通过内嵌的hive或者连接外部已经部署好的hive案例,实现了对hive语法的继
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:165888
    • 提供者:weixin_38731239
  1. Schedulis:Schedulis是一种高性能工作流任务调度系统,它支持高可用性和多租户财务级别功能,Linkis计算中间件,并且已集成到数据应用程序开发门户网站DataSphere Studio中-源码

  2. 简介 Schedulis是一个基于LinkedIn的开源项目开发的工作流任务调度系统。被集成到数据应用开发门户 。 Schedulis支持常规的Command Shell和Linkis(HadoopMR,Hive,Spark,Sqoop,Python)大数据任务;同时还支持特色的数据检查和工作流之间的依赖任务;支持完善的解决方案和工作流执行策略;提供多种类型的参数设置,动态变量和简单易用的UI。 与DataSphere Studio和Linkis的对接 DataSphere Studio可以将
  3. 所属分类:其它

    • 发布日期:2021-03-19
    • 文件大小:8388608
    • 提供者:weixin_42129970
  1. 基于Hadoop的数据仓库Hive基础知识

  2. Hive是基于Hadoop的数据仓库工具,可对存储在HDFS上的文件中的数据集进行数据整理、特殊查询和分析处理,提供了类似于SQL语言的查询语言–HiveQL,可通过HQL语句实现简单的MR统计,Hive将HQL语句转换成MR任务进行执行。数据仓库(DataWarehouse)是一个面向主题的(SubjectOriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反应历史变化(TimeVariant)的数据集合,用于支持管理决策。数据仓库体系结构通常含四个层次
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:701440
    • 提供者:weixin_38502292
  1. 大数据平台Docker应用之路

  2. 随着大数据平台型产品方向的深入应用实践和Docker开源社区的逐渐成熟,业界有不少的大数据研发团队开始拥抱Docker。简单来说,Docker会让Hadoop平台部署更加简单快捷、让研发和测试团队集成交付更加敏捷高效、让产线环境的运维更加有质量保障,而这背后的业务场景和具体的实践方法有哪些?在Docker容器服务逐步走向完善的过程中,大数据平台产品Docker模式的应用又是如何解决的?正是本文所着重阐述的。在大数据平台型产品的开发过程中,经常要跟许多模块打交道,包括Hadoop、HBase、Hi
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:285696
    • 提供者:weixin_38735544
  1. SequoiaDB+SparkSQL在数据统计场景的应用

  2. 在当前企业生产数据膨胀的时代,数据即使企业的价值所在,也是一家企业的技术挑战所在。所以在海量数据处理场景上,人们意识到单机计算能力再强也无法满足日益增长的数据处理需求,分布式才是解决该类问题的根本解决方案。而在分布式领域,有两类产品是至关重要的,分别分布式存储和分布式计算,用户只有将两者的特性充分利用,才可以真正发挥分布式架构的存储和计算能力。SequoiaDB是国内为数不多的自主研发的分布式数据库,特点是同时支持文档存储和块存储,支持标准SQL和事务功能,支持复杂索引查询、与Hadoop、Hi
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:300032
    • 提供者:weixin_38629303
  1. whids:Windows开源端点检测系统-源码

  2. 什么 这是一种混合解决方案,将灵活的主机IDS与基于检测的事件响应功能结合在一起。 该检测引擎建立在以前开发的规则引擎基础上, 专门设计用于将Windows事件与用户定义的规则进行匹配。 为什么 提供类似开源EDR的工具 灵活的检测 易于与其他开源工具(MISP,Hive ...)集成 怎么样 侦测 主机实时检测 侦听Windows事件日志通道并应用检测规则 用户定义的规则(我们知道为什么我们检测到某些东西) 设计用于MS 丰富Windows事件,以构建功能强大的检测原语 中央代理分发规则并
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:9437184
    • 提供者:weixin_42114645
  1. moqui-framework:使用Moqui Framework构建基于Java的企业应用程序。 它包括用于数据库(关系,图形,文档),本地和Web服务,具有屏幕和表格的Web和其他UI,安全性,文件资源访问,脚本,模板,l10n,缓存,

  2. 欢迎使用Moqui框架 有关代码,讨论,支持等的社区基础结构的信息,请参阅《社区指南》: 有关运行和部署Moqui的详细信息,请参见: 请注意,运行时目录是Moqui Framework运行所必需的,但不包含在源存储库中。 Gradle的get组件,加载和运行任务将自动添加默认运行时(来自moqui-runtime存储库)。 有关Moqui Framework当前和不久的将来状态的信息,请参见文件。 有关功能的概述,请参见: 可以通过以下教程快速开始Moqui开发: 有关Moqui
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:1048576
    • 提供者:weixin_42101237
  1. 应用程序启动器:Angular mono-repo(IonicCapacitorStencilJSWeb Component)应用程序启动器,用于支持跨平台应用程序-源码

  2. Hive App入门 使用最新技术快速构建Web和本机(iOS,Android,桌面)应用程序。 什么是Hive App Starter? Angular单一存储库设置,允许开发人员使用他们熟悉的技术在多个平台(Web /本地/桌面)之间无缝共享应用程序业务逻辑:Angular,Ionic,Capacitor和StencilJS(Web组件)。 是什么使该种子/启动器有用? 1.设计系统架构 在设计系统中设计和开发可重复使用的Web组件,该系统可在Storybook中进行预览,并具有外部集成和
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:1048576
    • 提供者:weixin_42181319
  1. 大数据平台Docker应用之路

  2. 随着大数据平台型产品方向的深入应用实践和Docker开源社区的逐渐成熟,业界有不少的大数据研发团队开始拥抱Docker。简单来说,Docker会让Hadoop平台部署更加简单快捷、让研发和测试团队集成交付更加敏捷高效、让产线环境的运维更加有质量保障,而这背后的业务场景和具体的实践方法有哪些?在Docker容器服务逐步走向完善的过程中,大数据平台产品Docker模式的应用又是如何解决的?正是本文所着重阐述的。 在大数据平台型产品的开发过程中,经常要跟许多模块打交道,包括Hadoop、HBase、H
  3. 所属分类:其它

    • 发布日期:2021-01-29
    • 文件大小:285696
    • 提供者:weixin_38698018
« 12 »