您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 2013年大数据技术峰会PPT(34篇)完整版

  2. 2013年大数据技术峰会PPT(34篇)完整版猛料上传。 资料包含了“大数据架构与系统”、“大数据技术”、“大数据应用”、“大数据的研发趋势”,“大数据基准测试(Benchmark)”,以及“智能交通与大数据” 六个分论坛及行业峰会。拟邀请近百位国内外顶级的大数据学术界专家和业界技术领袖坐而论道,内容涵盖数据获取与清 理、传输、存储、计算、挖掘、展现、开发平台与应用市场等方面,覆盖了数据生产的全生命周期。除了Hadoop 版本2.0系统YARN,以及Spark等新型系统架构介绍外,还将探讨流式
  3. 所属分类:其它

    • 发布日期:2013-12-16
    • 文件大小:58720256
    • 提供者:kingalong
  1. 大数据流式计算:关键技术及系统实例

  2. 大数据流式计算:关键技术及系统实例 计算机系统结构 GPU CPU
  3. 所属分类:网络设备

    • 发布日期:2014-05-31
    • 文件大小:1048576
    • 提供者:qq_16020339
  1. IBM分析大数据平台架构

  2. IBM InfoSphere Streams 是 IBM 大数据平台中支持构建和部署持续实时分析 应用程序以分析动态数据的技术组件。这些应用程序将持续不断地寻找数据流 中的模式。检测到模式后,将分析模式的影响,并即时制定实时决策,从而加 强竞争优势。示例包括分析金融市场交易行为、分析 RFID 数据以实现供应链和 分销链优化,监控传感器数据以支持制造流程控制,新生儿重症监护室监控, 实时欺诈防范和执法中的实时多模式监测。IBM InfoSphere Streams 能同时监 控多个外部和内部事
  3. 所属分类:其它

    • 发布日期:2015-08-22
    • 文件大小:894976
    • 提供者:qq_26764643
  1. 大数据日知录(1/2)

  2. 大数据是当前最为流行的热点概念之一,其已由技术名词衍生到对很多行业产生颠覆性影响的社会现象,作为最明确的技术发展趋势之一,基于大数据的各种新型产品必将会对每个人的日常生活产生日益重要的影响。 《大数据日知录:架构与算法》从架构与算法角度全面梳理了大数据存储与处理的相关技术。大数据技术具有涉及的知识点异常众多且正处于快速演进发展过程中等特点,其技术点包括底层的硬件体系结构、相关的基础理论、大规模数据存储系统、分布式架构设计、各种不同应用场景下的差异化系统设计思路、机器学习与数据挖掘并行算法以及层
  3. 所属分类:其它

    • 发布日期:2016-04-25
    • 文件大小:52428800
    • 提供者:thirdlucky
  1. 大数据日知录(2/2)

  2. 大数据是当前最为流行的热点概念之一,其已由技术名词衍生到对很多行业产生颠覆性影响的社会现象,作为最明确的技术发展趋势之一,基于大数据的各种新型产品必将会对每个人的日常生活产生日益重要的影响。 《大数据日知录:架构与算法》从架构与算法角度全面梳理了大数据存储与处理的相关技术。大数据技术具有涉及的知识点异常众多且正处于快速演进发展过程中等特点,其技术点包括底层的硬件体系结构、相关的基础理论、大规模数据存储系统、分布式架构设计、各种不同应用场景下的差异化系统设计思路、机器学习与数据挖掘并行算法以及层
  3. 所属分类:其它

    • 发布日期:2016-04-25
    • 文件大小:17825792
    • 提供者:thirdlucky
  1. 大数据流式计算系统研究综述

  2. 大数据流式计算系统研究综述
  3. 所属分类:Hadoop

    • 发布日期:2017-05-20
    • 文件大小:809984
    • 提供者:tox33
  1. 流式大数据处理

  2. Spark Structured Streaming的一些基本概念和工作原理
  3. 所属分类:spark

    • 发布日期:2017-08-24
    • 文件大小:1048576
    • 提供者:erjin_ren
  1. 大数据方案介绍_技术

  2. 大数据 技术平台 方案。 --- Hadoop是架构在廉价的硬件服务器上,不需要非常昂贵的硬件做支撑。2、 开源的产品,免费的,基于开源协议,可以自由修改,可控性更大。3、因为属于二次开发,同时因为有非常活跃的社区讨论,对开发人员的能力要求相对不高,工程师的学习成本也并不高。4、当集群规模非常大时,开发成本和维护成本会凸显出来。但是相对于自研系统来说的话,还是便宜的很多。 hadoop的整个生态体系,涵盖了系统数据存储、数据收集、数据导入导出到关系数据库、并行计算框架、数据序列化处理与任务调度
  3. 所属分类:Hadoop

    • 发布日期:2017-09-25
    • 文件大小:1048576
    • 提供者:wfeng007
  1. POI实现大数据EXCLE导入导出,解决内存溢出问题

  2. 使用POI能够导出大数据保证内存不溢出的一个重要原因是SXSSFWorkbook生成的EXCEL为2007版本,修改EXCEL2007文件后缀为ZIP打开可以看到,每一个Sheet都是一个xml文件,单元格格式和单元格坐标均用标签表示。直接使用SXSSFWorkbook来到导出EXCEL本身就是POI为了大数据量导出而量身定制的,所以导出可以直接使用SXSSFWorkbook方式。   为了保险起见可以采用多Sheet的方式保证内存不溢出。需要注意的是Sheet名称不能重复;下载的时候需要定义
  3. 所属分类:算法与数据结构

    • 发布日期:2017-10-16
    • 文件大小:34816
    • 提供者:youyou_yo
  1. flink流式处理框架的架构与应用

  2. flink的技术分享,现在将我的ppt整理成文档:flink流式处理框架的架构与应用
  3. 所属分类:flink

    • 发布日期:2017-10-22
    • 文件大小:3145728
    • 提供者:u013573133
  1. 大数据流式处理技术

  2. 大数据流式处理技术大数据流式处理技术大数据流式处理技术大数据流式处理技术
  3. 所属分类:spark

    • 发布日期:2017-11-06
    • 文件大小:3145728
    • 提供者:ljone
  1. 大数据-日知录-架构-算法(PDF高清完整版)

  2. 内容简介 大数据是当前最为流行的热点概念之一,其已由技术名词衍生到对很多行业产生颠覆性影响的社会现象,作为最明确的技术发展趋势之一,基于大数据的各种新型产品必将会对每个人的日常生活产生日益重要的影响。 《大数据日知录:架构与算法》从架构与算法角度全面梳理了大数据存储与处理的相关技术。大数据技术具有涉及的知识点异常众多且正处于快速演进发展过程中等特点,其技术点包括底层的硬件 体系结构、相关的基础理论、大规模数据存储系统、分布式架构设计、各种不同应用场景下的差异化系统设计思路、机器学习与数据挖掘并
  3. 所属分类:算法与数据结构

    • 发布日期:2017-11-23
    • 文件大小:70254592
    • 提供者:sbliu_rsgs
  1. 基于贝叶斯网络的复杂事件大数据处理系统测试数据生成方法研究

  2. 伴随流式数据处理需求而产生的复杂事件处理技术,在处理具有多样性和流式特征数据方面性能表现突出,被广泛应用于复杂事件大数据处理系统中。针对复杂事件大数据处理系统测试需求,提出一种基于贝叶斯网络的复杂事件大数据处理系统测试数据生成方法,该方法以部分真实数据中的复杂事件结构关系及概率分布特征构建贝叶斯网络预测模型,生成具有真实数据结构特征与分布特征的复杂事件测试数据集。实验结果表明,提出的方法具有可行性。
  3. 所属分类:算法与数据结构

    • 发布日期:2018-06-20
    • 文件大小:1048576
    • 提供者:qq_28339273
  1. kafka、storm、flink、apex、spark五种流式大数据系统调研报告

  2. 本文主要调研了Apache Kafka、Apache Flink、Apache Storm、Apache Apex和Apache Spark Streaming五种流式大数据系统。主要的工作有:1)通过文献阅读和试用比较了它们的实现原理;2)利用了kafka自带的测试脚本进行了kafka性能测试;3)通过Hibench进行了Flink、Storm和Spark Streaming的比较测试;4)进行了Apex的简单测试;5)对以上流式大数据系统进行了总结分析。
  3. 所属分类:Hadoop

    • 发布日期:2018-06-21
    • 文件大小:2097152
    • 提供者:selinaqqqq
  1. 基于流式计算的电信实时营销系统设计与实现.caj

  2. 在移动互联网时代,各式各样的新业务和新产品不断出现,通信市场的用户总体规模增长速度变缓,使运营商之间的竞争愈加激烈,新产品营销的时效性和准确度问题亟需解决。实时营销作为新的营销方式,具有较高的实时性,通过运用大数据分析技术分析用户上网行为特征,并在合适的时间、合适的地点向用户推荐合适的内容,从而提升用户感知、增加用户粘性。如何运用大数据技术实现实时营销是本文的重要内容。本文深入调研分析了大数据实时流式处理技术,并结合其在满足非功能性需求方面的独特优势,设计了一个可以同时满足大数据存储、大数据实时
  3. 所属分类:spark

    • 发布日期:2019-10-20
    • 文件大小:3145728
    • 提供者:weixin_41045909
  1. 大数据的原理

  2. 目前围绕Hadoop体系的大数据架构包括: 传统大数据架构 数据分析的业务没有发生任何变化,但是因为数据量、性能等问题导致系统无法正常使用,需要进行升级改造,那么此类架构便是为了解决这个问题。依然保留了ETL的动作,将数据经过ETL动作进入数据存储。数据分析需求依旧以BI场景为主,但是因为数据量、性能等问题无法满足日常使用。 流式架构 在传统大数据架构的基础上,流式架构数据全程以流的形式处理,在数据接入端将ETL替换为数据通道。经过流处理加工后的数据,以消息的形式直接推送给了消费者。存储部分在外
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:45056
    • 提供者:weixin_38686658
  1. 流式大数据处理的三种框架:Storm,Spark和Samza

  2. 许多分布式计算系统都可以实时或接近实时地处理大数据流。本文将对三种Apache框架分别进行简单介绍,然后尝试快速、高度概述其异同。在Storm中,先要设计一个用于实时计算的图状结构,我们称之为拓扑(topology)。这个拓扑将会被提交给集群,由集群中的主控节点(masternode)分发代码,将任务分配给工作节点(workernode)执行。一个拓扑中包括spout和bolt两种角色,其中spout发送消息,负责将数据流以tuple元组的形式发送出去;而bolt则负责转换这些数据流,在bolt
  3. 所属分类:其它

    • 发布日期:2021-02-26
    • 文件大小:333824
    • 提供者:weixin_38719578
  1. 流式大数据处理的三种框架:Storm,Spark和Samza

  2. 许多分布式计算系统都可以实时或接近实时地处理大数据流。本文将对三种Apache框架分别进行简单介绍,然后尝试快速、高度概述其异同。在Storm中,先要设计一个用于实时计算的图状结构,我们称之为拓扑(topology)。这个拓扑将会被提交给集群,由集群中的主控节点(master node)分发代码,将任务分配给工作节点(workernode)执行。一个拓扑中包括spout和bolt两种角色,其中spout发送消息,负责将数据流以tuple元组的形式发送出去;而bolt则负责转换这些数据流,在bol
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:333824
    • 提供者:weixin_38608189
  1. 流式大数据处理的三种框架:Storm,Spark和Samza

  2. 其他:Flink、Storm 将对三种Apache框架分别进行简单介绍,然后尝试快速、高度概述其异同。 Apache Storm 在Storm中,先要设计一个用于实时计算的图状结构,我们称之为拓扑(topology)。这个拓扑将会被提交给集群,由集群中的主控节点(master node)分发代码,将任务分配给工作节点(worker node)执行。一个拓扑中包括spout和bolt两种角色,其中spout发送消息,负责将数据流以tuple元组的形式发送出去;而bolt则负责转换这些数据流,在bo
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:53248
    • 提供者:weixin_38624628
  1. 流式大数据实时处理技术、平台及应用

  2. 大数据处理系统根据其时效性可分为批式大数据和流式大数据两类。上述两类系统均无法满足“事中”感知查询分析处理模式的需求。为此,从分析大数据应用场景入手,提出了“流立方”流式大数据实时处理技术和平台,在完整大数据集上实现了低迟滞、高实时的即席查询分析。目前基于“流立方”平台开发的业务系统已应用到金融风控反欺诈、机器防御等领域,具有广阔的应用前景。
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:1048576
    • 提供者:weixin_38631729
« 12 3 4 5 6 7 8 9 10 ... 40 »