您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 数据统计和分析论文的matlab源代码

  2. 网站的运营过程中,需要及时了解自身运营状况,结合运营状况调整营销策略和战略方针。而认识网站当前状态的最有效途径,便是数据,网站访问次数、访问人数、访问IP数,逗留时长等等都是很好的指导性指标。视频网站的运营亦是如此,相对于其他类型网站而言,视频网站需要更多其他定制的指标来指导。当前网络环境下存在多家第三方统计机构或工具,如艾瑞、Comscore、GA等。这些第三方统计机构能提供最基本、较笼统的数据,但对于高层决策者来说,这些还远远不够,他们需要的是有自身特色的、最好是可定制的指标,这些第三方机
  3. 所属分类:其它

    • 发布日期:2012-11-08
    • 文件大小:6144
    • 提供者:mmfile
  1. 实战Hadoop:开启通向云计算的捷径

  2. 第1章 神奇的大象——Hadoop 1.1 初识神象 1.2 Hadoop初体验 1.2.1 了解Hadoop的构架 1.2.2 查看Hadoop活动 1.3 Hadoop族群 1.4 Hadoop安装 1.4.1 在Linux系统中安装Hadoop 1.4.2 在Windows系统中安装Hadoop 1.4.3 站在象背上说“hello” 1.4.4 Eclipse下的Hadoop应用开发 参考文献 第2章 HDFS——不怕故障的海量存储 2.1 开源的GFS——HDFS 2.1.1 设计前
  3. 所属分类:其它

    • 发布日期:2013-07-31
    • 文件大小:61865984
    • 提供者:jsntghf
  1. 云资源下载V1.2

  2. Nosql (1)redis安置 (2)RedisAdminUI.zip (3)redis安装部署 (4)redis技术深层剖析及应用实践经验(sina微博) (5)Redis内存存储结构分析 (6)redis起步 (7)Redis容量及使用规划 (8)Redis新的存储模式diskstore (9)Redis学习笔记 (11)redis应用场景 (12)redis应用之日志汇总 (13)构建可扩展微博架构 (14)浅谈redis的键值设计 (15)浅谈redis数据库的键值设计 (16)为什
  3. 所属分类:其它

    • 发布日期:2014-07-05
    • 文件大小:205824
    • 提供者:w1025508785
  1. Spark 2.0.2 Spark 2.2 中文文档

  2. 本资源为网页,不是PDF Apache Spark 2.0.2 中文文档 Spark 概述 编程指南 快速入门 Spark 编程指南 概述 Spark 依赖 Spark 的初始化 Shell 的使用 弹性分布式数据集(RDDS) 并行集合 外部数据集 RDD 操作 RDD 持久化 共享变量 Broadcast Variables (广播变量) Accumulators (累加器) 部署应用到集群中 使用 Java / Scala 运行 spark Jobs 单元测试 Spark 1.0 版本前
  3. 所属分类:spark

    • 发布日期:2017-12-07
    • 文件大小:62
    • 提供者:huoyongjie698
  1. 异构数据源数据交换工具 DataX.zip

  2. 一. DataX3.0 概览  DataX 是一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle 等)、HDFS、Hive、ODPS、HBase、FTP 等各种异构数据源之间稳定高效的数据同步功能。  设计理念  为了解决异构数据源同步问题,DataX 将复杂的网状的同步链路变成了星型数据链路,DataX 作为中间传输载体负责连接各种数据源。当需要接入一个新的数据源的时候,只需要将此数据源对接到 DataX,便能跟已有的数据源做到无缝数据同步。  当前使用现状  
  3. 所属分类:其它

    • 发布日期:2019-07-19
    • 文件大小:23068672
    • 提供者:weixin_39841365
  1. cdh6.1.0搭建手册.pdf

  2. CDH是Cloudera公司推出的基于稳定版本的Apache Hadoop构建,是Hadoop众多分支中的一种。 CDH提供了Hadoop的核心元素 - 可扩展的存储和分布式计算 - 以及基于Web的用户界面和重要的企业功能。 CDH是Apache许可的开放源码,是唯一提供统一批处理,交互式SQL和交互式搜索以及基于角色的访问控制的Hadoop解决方案。 Cloudera作为一个强大的商业版数据中心管理工具,提供了各种能够快速稳定运行的数据计算框架,如Apache Spark;使用Apache
  3. 所属分类:互联网

    • 发布日期:2020-04-01
    • 文件大小:3145728
    • 提供者:weixin_44160803
  1. Hive用户指南(Hive_user_guide)_中文版.pdf

  2. 1. HIVE结构 Hive 是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数 据提取转化加载 (ETL),这是一种可以存储、 查询和分析存储在 Hadoop 中的大规模数据的 机制。 Hive 定义了简单的类 SQL 查询语言,称为 QL,它允许熟悉 SQL 的用户查询数据。 同时,这个语言也允许熟悉 MapReduce 开发者的开发自定义的 mapper 和 reducer 来处理 内建的 mapper 和 reducer 无法完成的复杂的分析工作
  3. 所属分类:其它

    • 发布日期:2020-01-14
    • 文件大小:1048576
    • 提供者:weixin_45524326
  1. Airflow使用指南【About云整理】.pdf

  2. About云整理的Airflow使用指南 1. 如何安装和配置 Airflow? 2. 如何通过 Airflow UI 监控 data pipeline (管道)并对其进行故障排除 3. 什么是 Airflow Platform ? 4. Airflow 是如何进行数据分析,追踪数据,调试数据流的? 5. Airflow 命令行接口的基本操作有哪些?www.aboutyun.com活到老学到老 以下是一些将触发一些任务实例的命令。在运行以下命令时,您应该能够在 example bash
  3. 所属分类:Hadoop

    • 发布日期:2019-06-30
    • 文件大小:2097152
    • 提供者:bj278595437
  1. 新闻日志大数据分析及可视化系统的设计与实现.doc

  2. 每天都有着大量的用户关注各类新闻,特别是随着各种网络通信技术的发展,网络应用的普及使得每时每刻都有着大量的人们通过网络进行各类新闻的搜索,产生海量的日志数据。过去使用单机的方式通过 MySQL数据库对这些数据进行存储,但是积累下来的用户日志数据量达到了一定的级别,当一台电脑无法存储这么庞大的数据时,就产生了海量数据的存储问题。如果使用网络文件系统对数据进行分开存储,那么就无法对大量的实时和离线数据进行分析处理,处理结果也无法以一种更加直观的方式进行展示。 为了解决海量新闻日志数据的存储问题,在新
  3. 所属分类:互联网

    • 发布日期:2020-08-15
    • 文件大小:2097152
    • 提供者:beans9
  1. redash-源码

  2. Redash是我们致力于以更适合我们的文化和使用方式的方式释放公司内部数据的方式。 在Redash之前,我们尝试使用传统的BI套件,并发现了一组of肿,技术难题和缓慢的工具/流程。 我们正在寻找的是一种更像黑客的方式来查看数据,因此我们构建了一种。 Redash的构建是为了允许快速轻松地访问我们使用Amazon Redshift(“讲PostgreSQL”的“ PB级数据仓库”)处理和收集的数十亿条记录。 今天, Redash支持查询多个数据库,包括:Redshift,Google BigQ
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:29360128
    • 提供者:weixin_42123191
  1. 使用Hive构建数据库

  2. 当您需要处理大量数据时,存储它们是一个不错的选择。令人难以置信的发现或未来预测不会来自未使用的数据。大数据是一个复杂的怪兽。用Java?编程语言编写复杂的MapReduce程序要耗费很多时间、良好的资源和专业知识,这正是大部分企业所不具备的。这也是在Hadoop上使用诸如Hive之类的工具构建数据库会成为一个功能强大的解决方案的原因。如果一家公司没有资源构建一个复杂的大数据分析平台,该怎么办?当业务智能(BI)、数据仓库和分析工具无法连接到ApacheHadoop系统,或者它们比需求更复杂时,又
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:198656
    • 提供者:weixin_38642369
  1. Impala和Hive的关系(详解)

  2. Impala是基于Hive的大数据实时分析查询引擎,直接使用Hive的元数据库Metadata,意味着impala元数据都存储在Hive的metastore中。并且impala兼容Hive的sql解析,实现了Hive的SQL语义的子集,功能还在不断的完善中。Impala与Hive都是构建在Hadoop之上的数据查询工具各有不同的侧重适应面,但从客户端使用来看Impala与Hive有很多的共同之处,如数据表元数据、ODBC/JDBC驱动、SQL语法、灵活的文件格式、存储资源池等。Impala与Hi
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:425984
    • 提供者:weixin_38722164
  1. yacht_hive:一个在Flutter上使用Hive进行实践的原型项目-源码

  2. yacht_hive 这是一个使用Hive进行调查的原型项目。 资料夹结构 文件夹结构将为每个功能提供一个高级文件夹。 在这种情况下,只有一艘游艇。 也将有一个用于共享代码的高级文件夹。 这将称为核心。 核心文件夹分为: 数据库-访问sqlite数据库的通用代码。 每个功能文件夹均分为: 应用程序-包含应用程序的业务逻辑。 它执行表示层和基础结构层之间的交互。 它不应包含任何表示代码或数据库特定的代码。 域-包含功能的数据模型。 基础结构-包含功能的存储库。 在此将执行数据库,网络
  3. 所属分类:其它

    • 发布日期:2021-02-16
    • 文件大小:1048576
    • 提供者:weixin_42098830
  1. moqui-framework:使用Moqui Framework构建基于Java的企业应用程序。 它包括用于数据库(关系,图形,文档),本地和Web服务,具有屏幕和表格的Web和其他UI,安全性,文件资源访问,脚本,模板,l10n,缓存,

  2. 欢迎使用Moqui框架 有关代码,讨论,支持等的社区基础结构的信息,请参阅《社区指南》: 有关运行和部署Moqui的详细信息,请参见: 请注意,运行时目录是Moqui Framework运行所必需的,但不包含在源存储库中。 Gradle的get组件,加载和运行任务将自动添加默认运行时(来自moqui-runtime存储库)。 有关Moqui Framework当前和不久的将来状态的信息,请参见文件。 有关功能的概述,请参见: 可以通过以下教程快速开始Moqui开发: 有关Moqui
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:1048576
    • 提供者:weixin_42101237
  1. bdp-dataplatform:大数据生态解决方案数据平台:基于大数据,数据平台,微服务,机器学习,商城,自动化运维,DevOps,容器部署平台,数据平台,数据平台存储,数据平台计算,数据平台开发,数据平台应用构建的大数据解决方案-源码

  2. 总项目 0,大数据生态解决方案数据平台 数据平台: bdp-dataplatform:基于大数据、数据平台、微服务、机器学习、商城、自动化运维、DevOps、容器部署平台、数据平台采集、数据平台存储、数据平台计算、数据平台开发、数据平台应用搭建的大数据解决方案。 数据来源: 商城:使用SpringBoot,Java,Vue,React,Android开发多端商城,包括网站、App、微信小程序; 日志:使用Java开发服务端日志、客户端日志收集系统,使用DataX实现数据的导入导出系统;
  3. 所属分类:其它

    • 发布日期:2021-02-01
    • 文件大小:41943040
    • 提供者:weixin_42166105
  1. 使用Hive构建数据库

  2. 当您需要处理大量数据时,存储它们是一个不错的选择。令人难以置信的发现或未来预测不会来自未使用的数据。大数据是一个复杂的怪兽。用 Java?编程语言编写复杂的MapReduce程序要耗费很多时间、良好的资源和专业知识,这正是大部分企业所不具备的。这也是在 Hadoop上使用诸如Hive之类的工具构建数据库会成为一个功能强大的解决方案的原因。如果一家公司没有资源构建一个复杂的大数据分析平台,该怎么办?当业务智能(BI)、数据仓库和分析工具无法连接到
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:198656
    • 提供者:weixin_38560039
  1. Impala和Hive的关系(详解)

  2. Impala是基于Hive的大数据实时分析查询引擎,直接使用Hive的元数据库Metadata,意味着impala元数据都存储在Hive的metastore中。并且impala兼容Hive的sql解析,实现了Hive的SQL语义的子集,功能还在不断的完善中。Impala与Hive都是构建在Hadoop之上的数据查询工具各有不同的侧重适应面,但从客户端使用来看Impala与Hive有很多的共同之处,如数据表元数 据、ODBC/JDBC驱动、SQL语法、灵活的文件格式、存储资源池等。Impala与H
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:425984
    • 提供者:weixin_38637878
  1. presto-ignite-connector-plugin-源码

  2. presto-ignite连接器插件 此连接器将帮助您从presto查询内存数据库中的ignite( )。 这反过来又可以帮助您将点火数据与其他数据库(例如cassandra,hive等)结合在一起。 步骤来建立罐子 使用以下命令构建jar mvn全新安装 Jar ignite-presto-connector-331-0.0.1-SNAPSHOT-jar-with-dependencies.jar将在目标文件夹中生成。 创建一个文件夹/ p​​lugin / ignite 4.将所有
  3. 所属分类:其它

    • 发布日期:2021-04-01
    • 文件大小:13312
    • 提供者:weixin_42137032
  1. hms-mirror:将Hive表定义复制到Compute Cluster,同时仍在原始群集上使用存储-源码

  2. HMS镜 “ hms-mirror”是用于弥合两个群集之间的距离并迁移hive元数据和数据的实用程序。 HMS-Mirror是根据许可证发行的。 获取此自述文件的。 设置 二进制包 不要构建,在这里下载最新的二进制文件!!! 从二进制分发的HMS镜像设置 在edgenode上: 展开压缩包tar zxvf hms-mirror-dist.tar.gz 。 这将生成一个子hms-mirror目录。 以root用户(或sudo ) hms-mirror/setup.sh运行hms-mirror
  3. 所属分类:其它

    • 发布日期:2021-03-30
    • 文件大小:731136
    • 提供者:weixin_42175776