您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 2013年阿里技术嘉年华嘉宾PPT分享(大数据处理)

  2. 2013年阿里技术嘉年华嘉宾PPT分享(大数据处理),各个嘉宾的PPT分享,受益匪浅。
  3. 所属分类:Web开发

    • 发布日期:2013-08-26
    • 文件大小:33554432
    • 提供者:smilecnf
  1. 大数据与数据仓库 Data Warehousing in the Age of Big Data

  2. 大数据与数据仓库 Data Warehousing in the Age of Big Data 大数据时代的数据仓库技术,大数据处理技术,案例分析
  3. 所属分类:电子商务

    • 发布日期:2015-01-10
    • 文件大小:16777216
    • 提供者:yisimonsz
  1. 加百力金融大数据处理与实战讲座课件代码

  2. 金融大数据课程代码,加百力出品 《基础篇》10节课目录及内容介绍: 01、课程介绍 介绍课程的意义、基本结构、课程讲述方法 02、R基础知识 介绍:变量赋值、分支结构、循环结构、函数使用、获取帮助等知识 03、R常用数据结构 介绍向量、数组、列表、数据框、日期时间等数据结构的基础知识,以及生成这些结构的方法 04、R的数据操作 R提供了极其灵活的方式,访问、修改、扩充、删除、计算向量、列表、数据框等基础数据结构 05、R的重要数据分析函数 介绍R中很多重要、常用的数据分析函数 06、R基础绘图技
  3. 所属分类:其它

    • 发布日期:2019-03-16
    • 文件大小:226304
    • 提供者:futurech
  1. 大数据处理的基本流程:数据抽取与集成+数据分析+数据解释

  2. 大数据的数据来源广泛,应用需求和数据类型都不尽相同,但是最基本的处理流程是一致的。 整个大数据的处理流程可以定义为,在合适工具的辅助下,对广泛异构的数据源进行抽取和集成,将结果按照一定的标准进行统一存储,然后利用合适的数据分析技术对存储的数据进行分析,从中提取有益的知识,并利用恰当的方式将结果展现给终端用户。 具体来讲,大数据处理的基本流程可以分为数据抽取与集成、数据分析和数据解释等步骤。 数据抽取与集成 大数据的一个重要特点就是多样性,这就意味着数据来源极其广泛,数据类型极为繁杂。这种复杂的
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:69632
    • 提供者:weixin_38563871
  1. Android SQLite操作之大数据处理与同时读写方法

  2. 本文实例讲述了Android SQLite操作之大数据处理与同时读写方法。分享给大家供大家参考,具体如下: 1. 批量写入 采用事物方式,先缓存数据,再批量写入数据,极大提高了速度 288条,直接inset into 耗时7秒 8640条,   批量写入 耗时5-7秒 try { this.myDataBase.beginTransaction(); // 手动设置开始事务 for (int i = 0; i < objArr.length; i++) { this.myD
  3. 所属分类:其它

    • 发布日期:2021-01-04
    • 文件大小:48128
    • 提供者:weixin_38706455
  1. 大数据处理的可配置混合内存架构研究

  2. 本文提出了一种用于大数据处理的可配置混合存储架构(CHMA)。 它包括计算节点和内存节点。 可以根据不同应用的需求配置计算节点,以提高计算系统的适用性。 存储器节点包含存储器控制芯片和存储器网络,这些存储器控制芯片和存储器网络支持用不同类型的存储器设备来构建存储器系统。 每个内存控制芯片包含两个内存控制器。 提出了两种关键技术来优化CHMA的内存访问的带宽和等待时间,一种是多通道并行总线结构,另一种是插入到内存控制芯片中的缓存或缓冲区结构。 实验结果表明:首先,两个存储控制器集成在存储控制芯片中
  3. 所属分类:其它

    • 发布日期:2021-03-06
    • 文件大小:740352
    • 提供者:weixin_38607282
  1. Hadoop大数据处理 内含2.7.6 和2.7.7

  2. Hadoop是大数据处理主流框架,如果要学习大数据处理与存储,hadoop是必须掌握的一种框架技术。动手安装是最基础的实践, 内含2.7.6 和2.7.7 教程:https://blog.csdn.net/llm765800916/article/details/114323454
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:435159040
    • 提供者:llm765800916
  1. 大数据处理中的Lambda架构和Kappa架构

  2. 首先我们来看一个典型的互联网大数据平台的架构,如下图所示:在这张架构图中,大数据平台里面向用户的在线业务处理组件用褐色标示出来,这部分是属于互联网在线应用的部分,其他蓝色的部分属于大数据相关组件,使用开源大数据产品或者自己开发相关大数据组件。你可以看到,大数据平台由上到下,可分为三个部分:数据采集、数据处理、数据输出与展示。将应用程序产生的数据和日志等同步到大数据系统中,由于数据源不同,这里的数据同步系统实际上是多个相关系统的组合。数据库同步通常用Sqoop,日志同步可以选择Flume,打点采集
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:212992
    • 提供者:weixin_38576561
  1. 用ApacheSpark进行大数据处理

  2. ApacheSpark是一个围绕速度、易用性和复杂分析构建的大数据处理框架。最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一。与Hadoop和Storm等其他大数据和MapReduce技术相比,Spark有如下优势。首先,Spark为我们提供了一个全面、统一的框架用于管理各种有着不同性质(文本数据、图表数据等)的数据集和数据源(批量数据或实时的流数据)的大数据处理的需求。Spark可以将Hadoop集群中的应用在内存中的运行速度提升100倍,甚
  3. 所属分类:其它

    • 发布日期:2021-02-26
    • 文件大小:204800
    • 提供者:weixin_38614377
  1. Spark大数据处理系列之MachineLearning

  2. 最近几年,机器学习、预测分析和数据科学主题得到了广泛的关注。Spark的机器学习库(SparkMLlib),包括各种机器学习算法:协同过滤算法、聚类算法、分类算法和其他算法。在前面的《Spark大数据处理》系列文章,介绍ApacheSpark框架,介绍如何使用SparkSQL库的SQL接口去访问数据,使用SparkStreaming进行实时流式数据处理和分析。在本篇文章,作者将讨论机器学习概念以及如何使用SparkMLlib来进行预测分析。后面将会使用一个例子展示SparkMLlib在机器学习领
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:249856
    • 提供者:weixin_38698590
  1. Hanhan_Data_Science_Practice:数据分析,大数据开发,云和任何其他有趣的东西!-源码

  2. Hanhan_Data_Science_Practice 数据分析,大数据开发,云计算以及其他任何很棒的东西! 大数据! - 极好的 为什么Spark很棒? Spark非常适合处理大数据问题! 天哪,在处理真正的大数据之前,我只是觉得它很酷而且很聪明! 今天我意识到,这真是太棒了! 特别是在我对4000000个文本记录(2G)编写了普通的Python迭代代码以提取多种模式之后。 我的普通python迭代代码,方法1: : 我的普通python迭代代码,方法2: : 我的Spark
  3. 所属分类:其它

    • 发布日期:2021-02-23
    • 文件大小:62914560
    • 提供者:weixin_42181888
  1. One_Click_Boom-ocb:一键式解决方案,用于设置大数据处理环境。 Installl是所有bash文件所在的父目录。 只需在终端中通过命令“ chmod 777 *”向位于installl目录内的所有bash文件提供权限-源码

  2. One_Click_Boom-ocb 一键式设置大数据处理环境的解决方案。 Installl是所有bash文件所在的父目录。 只需在终端中通过命令“ chmod 777 *”为位于installl目录内的所有bash文件提供许可即可。
  3. 所属分类:其它

    • 发布日期:2021-02-19
    • 文件大小:7168
    • 提供者:weixin_42132056
  1. Hadoop_MapReduce:使用Hadoop进行大数据处理-源码

  2. Hadoop_MapReduce 使用Hadoop进行大数据处理 该项目在Hadoop框架上使用Map-Reduce从零开始实现基本的文本处理任务,例如字数,n元语法,倒排索引,关系连接和k近邻算法。
  3. 所属分类:其它

    • 发布日期:2021-02-15
    • 文件大小:8388608
    • 提供者:weixin_42116791
  1. 用ApacheSpark进行大数据处理

  2. ApacheSpark是一个围绕速度、易用性和复杂分析构建的大数据处理框架。最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一。与Hadoop和Storm等其他大数据和MapReduce技术相比,Spark有如下优势。首先,Spark为我们提供了一个全面、统一的框架用于管理各种有着不同性质(文本数据、图表数据等)的数据集和数据源(批量数据或实时的流数据)的大数据处理的需求。Spark可以将Hadoop集群中的应用在内存中的运行速度提升100倍,甚
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:204800
    • 提供者:weixin_38749863
  1. Spark大数据处理系列之MachineLearning

  2. 最近几年,机器学习、预测分析和数据科学主题得到了广泛的关注。Spark的机器学习库(Spark MLlib),包括各种机器学习算法:协同过滤算法、聚类算法、分类算法和其他算法。在前面的《Spark大数据处理》系列文章,介绍ApacheSpark框架,介绍如何使用SparkSQL库的SQL接口去访问数据,使用Spark Streaming进行实时流式数据处理和分析。在本篇文章,作者将讨论机器学习概念以及如何使用SparkMLlib来进行预测分析。后面将会使用一个例子展示Spark
  3. 所属分类:其它

    • 发布日期:2021-01-29
    • 文件大小:249856
    • 提供者:weixin_38666785
  1. 大数据处理中的Lambda架构和Kappa架构

  2. 首先我们来看一个典型的互联网大数据平台的架构,如下图所示:在这张架构图中,大数据平台里面向用户的在线业务处理组件用褐色标示出来,这部分是属于互联网在线应用的部分,其他蓝色的部分属于大数据相关组件,使用开源大数据产品或者自己开发相关大数据组件。你可以看到,大数据平台由上到下,可分为三个部分:数据采集、数据处理、数据输出与展示。将应用程序产生的数据和日志等同步到大数据系统中,由于数据源不同,这里的数据同步系统实际上是多个相关系统的组合。数据库同步通常用 Sqoop,日志同步可以选择Flume,打点采
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:212992
    • 提供者:weixin_38551205
  1. 用于实时大数据处理的Lambda架构

  2. 这里要讲的 Lambda 是一个实时大数据处理框架,而不是 AWS 的同名服务,但是其中所强调的容错性、横向扩容、易于维护等通用性质的概念却是二者都具备的,对于 AWS Lambda 感兴趣的可以看博客的另外一篇文章《Serverless(无服务器) 架构入门 by Lambda》或访问 AWS 官方了解。
  3. 所属分类:其它

    • 发布日期:2021-01-26
    • 文件大小:358400
    • 提供者:weixin_38722164
  1. 智慧城市多源异构大数据处理框架

  2. 智慧城市建设的重心已由传统IT系统和信息资源共享建设,转变为数据的深度挖掘利用和数据资产的运营流通。大数据中心是数据资产管理和利用的实体基础,其核心驱动引擎是大数据平台及各类数据挖掘与分析系统。讨论了智慧城市大数据中心建设的功能架构,围绕城市多源异构数据处理的实际需要,对数据中心大数据平台的架构进行了拆分讲解,并以视频大数据处理为例,阐述了数据中心中大数据平台的运转流程。
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:1048576
    • 提供者:weixin_38612811
  1. 数据流技术在GPU和大数据处理中的应用

  2. 数据流模型是一种高效的计算模型,由于其在并行性方面具有天然的优势,数据流技术在软硬件领域得到了广泛的应用。在硬件体系结构方面,数据流模型引领计算机体系结构在传统冯·诺伊曼架构下向支持更高并发的方向发展。基于超长向量处理单元的流处理和SIMT的现代GPU就广泛使用了数据流技术的思想。在编程模型方面,数据流思想在大数据编程模型领域得到了广泛应用,例如MapReduce和Spark等。从数据流模型的角度多层次分析了英伟达GPU的体系结构以及CUDA编程模型,阐述了数据流模型在GPU软硬件系统中的应用。
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:1048576
    • 提供者:weixin_38699784
  1. 数据流计算模型及其在大数据处理中的应用

  2. 如今无界、乱序的大规模数据集越来越普遍,并且消费者对这些数据集的处理需求日益复杂,如时间语义、窗口以及处理时延等。针对在无界、乱序的大规模数据集上演进的数据处理需求,探讨了大数据处理中的数据流计算模型。一方面,从执行引擎层面分析了大数据处理中的数据流计算模型所体现的数据流图;另一方面,从统一编程层面分析了大数据处理中的数据流计算模型所体现的数据流编程模型。在此基础上,进一步结合Spark批处理引擎和Flink流计算引擎等多个执行引擎,对比分析了数据流图和数据流编程模型在2类执行引擎中的具体实现。
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:1048576
    • 提供者:weixin_38587473
« 12 3 4 5 6 7 8 9 10 ... 50 »