您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于云计算的虚拟银行海量数据存储设计

  2. 本论文的主要工作是在基于云计算理论的基础上设计适合JEPAY 虚拟银行数据特点的云存储系统,系统的设计工作主要分为两个方面: 一个方面是设计能够为银行数据库提供文件支持的分布式文件系统。对于当前的云计算系统,因为文件只能写入不能修改,不能为银行提供数据支持。我们的工作就是在底层构架能够满足银行数据要求的分布式系统, 传统的分布式数据库的扩展性是不够灵活的,比如他们在动态的增减节点时付出的代价很大,并且他们把这种情况当作一种错误处理,严重影响系统的性能和扩展。在论文中我们参考了Hadoop的构架
  3. 所属分类:专业指导

    • 发布日期:2009-12-26
    • 文件大小:717824
    • 提供者:loverevive
  1. Memlink是一个高性能、持久化、分布式的Key=>List/Queue数据引擎

  2. memlink函数,nosql数据库,天涯论坛数据库,海量数据快速存取,内存数据库 天涯社区最近开发了一款数据引擎——Memlink,并将其开源。对于为什么会出现这样一款开源项目、它的能力和市面上的其他款同类型项目相比有怎样的优势 近些年,Nosql系统非常流行,也确实对sql系统进行了合理补充,为Web应用提供多种数据解决方案。但是在开源Nosql系统中,key-value系统可选择较多,而key-list/queue系统可选择较少,因此我们开发了memlink来满足我们自己的需要。 在这里
  3. 所属分类:其它

    • 发布日期:2011-04-01
    • 文件大小:6144
    • 提供者:yangna2429
  1. 基于Map/Reduce的分布式搜索引擎研究

  2. 【摘要】在对Map/Reduce算法进行分析的基础上,利用开源Hadoop软件设计出高容错高性能的分布式搜索引擎,以面对搜索引擎对海量数据的处理和存储问题。
  3. 所属分类:互联网

    • 发布日期:2011-06-03
    • 文件大小:440320
    • 提供者:cool_time
  1. 海量数据处理文档集合

  2. 海量数据库建设的一些文档,主要包括数据库性能优化,分布式数据库建设等等
  3. 所属分类:互联网

    • 发布日期:2011-08-02
    • 文件大小:522240
    • 提供者:lq312658076
  1. hadoop源码分析

  2. Hadoop源代码分析(六) 既然是RPC,自然就有客户端和服务器,当然,org.apache.hadoop.rpc也就有了类Client和类Server。在这里我们来仔细考察org.apache.hadoop.rpc.Client。下面的图包含了org.apache.hadoop.rpc.Client中的关键类和关键方法。 由于Client可能和多个Server通信,典型的一次HDFS读,需要和NameNode打交道,也需要和某个/某些DataNode通信。这就意味着某一个Client需要维
  3. 所属分类:其它

    • 发布日期:2011-10-09
    • 文件大小:5242880
    • 提供者:dutianmin
  1. 海量数据处理平台体系架构分析

  2. 综述了主流海量数据分析平台的架构,以hadoop为例详细分析了分布式结构在当前海量数据处理汇总的应用。
  3. 所属分类:互联网

    • 发布日期:2012-12-15
    • 文件大小:657408
    • 提供者:hohai2337
  1. 海量数据的分布式事务处理

  2. 海量数据的分布式事务处理,Google的论文。
  3. 所属分类:其它

    • 发布日期:2012-12-28
    • 文件大小:224256
    • 提供者:cising
  1. 海量数据挖掘

  2. 海量数据处理 hadoop是一个分布式框架,利用它进行分布式计算
  3. 所属分类:其它

    • 发布日期:2013-03-15
    • 文件大小:1048576
    • 提供者:steveteng
  1. 基于云计算的海量数据挖掘_何清

  2. 云计算是一种基于互联网的、大众参与的计算模式,其计算资源(计算能力、存储能力、交互能力)是动态、可伸缩、且被虚拟化的,以服务的方式提供。云计算是并行计算(Parallel Computing)、分布式计算(Distributed Computing)和网格计算(Grid Computing)的发展,或者说是这些计算机科学概念的商业实现。云计算是虚拟化(Virtualization)、效用计算(UtilityComputing)、IaaS(基础设施即服务)、PaaS(平台即服务)、SaaS(软件
  3. 所属分类:Web开发

    • 发布日期:2013-12-17
    • 文件大小:1048576
    • 提供者:u013185451
  1. 商剑分布式网络蜘蛛(网络爬虫-spider)

  2. 商剑分布式网络蜘蛛,性能高速运转,能耗尽全部带宽,可批量采集海量数据的网页,若几百台服务器安装商剑分布式网络蜘蛛,分块同时抓取整个WEB不同站点,短时期内可以抓取100亿网页!商剑分布式网络蜘蛛,是大型搜索引擎架构的必备工具, 更是搜索引擎-网络蜘蛛-网络爬虫-spider-网页抓取等技术的必备工具之一。http://www.100spider.cn/wspider.rar
  3. 所属分类:网络基础

    • 发布日期:2008-10-16
    • 文件大小:2097152
    • 提供者:spider100
  1. 2007数据分析与业务建模

  2. 数据分析与业务建模:随着数据仓库的不断发展和成熟,“大数据”概念的风靡,有越来越多的相关产品出来,最常见的技术解决方案包括hadoop和hive,oracle,mysql的infobright,greenplum及nosql,或者多个结合使用。   其实归纳起来就两类:一是用传统RDBMS为主导的数据库管理数据,oracle、mysql等都是基于传统的关系型数据库,优势就是有更严谨的数据结构,关系型数据库对数据的管理更加规范,数据处理过程中可能出现的非人为误差极小,而且标准的SQL接口使数据获
  3. 所属分类:专业指导

    • 发布日期:2014-07-09
    • 文件大小:13631488
    • 提供者:qq_17451641
  1. 海量数据处理

  2. 海量数据处理相关 所谓海量数据处理,是指基于海量数据的存储、处理、和操作。正因为数据量太大,所以导致要么无 法在较短时间内迅速解决,要么无法一次性装入内存。 事实上,针对时间问题,可以采用巧妙的算法搭配合适的数据结构(如布隆过滤器、哈希、位图、堆、 数据库、倒排索引、Trie 树)来解决;而对于空间问题,可以采取分而治之(哈希映射)的方法,也就是 说,把规模大的数据转化为规模小的,从而各个击破。 此外,针对常说的单机及集群问题,通俗来讲,单机就是指处理装载数据的机器有限(只要考虑 CPU、 内
  3. 所属分类:其它

    • 发布日期:2014-08-28
    • 文件大小:932864
    • 提供者:yangdedipan1234
  1. 大型分布式网站架构设计与实践.带目录书签.完整版.rar

  2. 《大型分布式网站架构设计与实践》主要介绍了大型分布式网站架构所涉及的一些技术细节,包括SOA架构的实现、互联网安全架构、构建分布式网站所依赖的基础设施、系统稳定性保障和海量数据分析等内容;深入地讲述了大型分布式网站架构设计的核心原理,并通过一些架构设计的典型案例,帮助读者了解大型分布式网站设计的一些常见场景及遇到的问题。 作者结合自己在阿里巴巴及淘宝网的实际工作经历展开论述。《大型分布式网站架构设计与实践》既可供初学者学习,帮助读者了解大型分布式网站的架构,以及解决问题的思路和方法,也可供业界
  3. 所属分类:Web开发

    • 发布日期:2015-11-02
    • 文件大小:72351744
    • 提供者:celestialtao
  1. 海量数据引擎SF1R.zip

  2. 什么是SF1R SF1R是一个分布式的存储搜索一体化海量数据引擎。SF1R来自于iZENECloud团队多年的 研发成果,并且已经在商业网站上经受住了严苛的考验。2014年,iZENECloud团队把SF1R 开放给社区,采用Apache License 2,希望共同改进和维护。 Note SF1R的全称是Search Formula 1 Revolution,SF1R是iZENECloud团队给搜索引擎项目使用的内部代号。 SF1R的历史和特色 SF1R是
  3. 所属分类:其它

    • 发布日期:2019-07-16
    • 文件大小:5242880
    • 提供者:weixin_39840650
  1. 基于大数据平台构建数据仓库的研究与实践.pdf

  2. 数据仓库设计文档,帮助大家理解及如何设计数据仓库,很不错的一篇论文。专题 lTo 学习体系,能从海量数据中提炼高价值信息,构建自主 (1)源系统结构化数据:源系统按大数据平合的 训练与反馈、可不断从最新数据中调整演化的智能业务供数规范要求提供表数据文本和标志文件。 模型体系。 (2)文件交换区FSA:文件的交换中枢,含源系 以 Hadoop^ Spark为代表的大规模数据处理技术为统结构化数据和半结构化、非结构化数据(主要是外部 超越传统数据库的处理局限性提供了先进的并行计算和数据)。 资源调度
  3. 所属分类:其它

    • 发布日期:2019-07-16
    • 文件大小:1048576
    • 提供者:bucaixia08
  1. 基于GemFire的海量数据计算性能实验分析

  2. 针对交通领域多源动态海量数据高性能计算的实时性、动态扩展性处理要求,提出了一种基于GemFire的分布式内存数据库实验平台,采用键-值数据存储结构和分布式动态成员关系,通过加载浮动车系统的真实数据在完整的云计算架构下,进行了计算性能测试与分析。实验结果表明,该平台可将千万级以上大数据量的计算时间缩短至原系统的10%以内,满足了交通物联网云平台整合利用各子系统数据资源的应用需求。
  3. 所属分类:其它

    • 发布日期:2021-03-05
    • 文件大小:956416
    • 提供者:weixin_38586279
  1. 大数据中的SMAQ技术

  2. 所谓海量数据,是指数据的规模大到已经难以使用传统的方式来处理。最早面临这个问题的是网络搜索引擎,而如今,社会化网络,移动电话、各种传感器和科学计算每天增长数以PB计的数据。围绕Google关于这方面的工作和Yahoo的Haoop中对MapReduce的实现,兴起了一个海量数据处理工具的生态系统。随着MapReduce越来越广为人知,更多的海量数据系统开始涌现,包括了存储、MapReduce和查询等不同领域。所有的SMAQ都以开源、分布式以及运行在普通硬件上为特征。就像LAMP给web应用开发带来
  3. 所属分类:其它

    • 发布日期:2021-03-04
    • 文件大小:253952
    • 提供者:weixin_38601499
  1. 致力于构建用于大规模遥感图像处理的多数据中心基础架构

  2. 地球观测应用程序现在面临管理和处理海量数据集的挑战来自大型分布式数据中心(DC)的多个来源。 为了解决这个研究问题,这个白皮书介绍了用于管理和处理海量数据的多个数据中心(MDC)的基础架构遥感图像。 提议的系统建立在两组分布式DC /集群上, 配备了DC或群集资源管理器。 介绍访问安全性和信息服务支持这种MDC体系结构。 我们共同组织了该算法,数据属于MDC以工作流程的方式。 在实践中,我们成功地解决了有关协同处理应用程序中的程序,并快速传输大量的遥感数据集并具有稳定的跨MDC。 在前面提到的研
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:1048576
    • 提供者:weixin_38502722
  1. 大数据中的SMAQ技术

  2. 所谓海量数据,是指数据的规模大到已经难以使用传统的方式来处理。最早面临这个问题的是网络搜索引擎,而如今,社会化网络,移动电话、各种传感器和科学计算每天增长数以PB计的数据。围绕Google关于这方面的工作和Yahoo的Haoop中对MapReduce的实现,兴起了一个海量数据处理工具的生态系统。随着MapReduce越来越广为人知,更多的海量数据系统开始涌现,包括了存储、MapReduce和查询等不同领域。所有的SMAQ都以开源、分布式以及运行在普通硬件上为特征。就像LAMP给web应用开发带来
  3. 所属分类:其它

    • 发布日期:2021-02-21
    • 文件大小:253952
    • 提供者:weixin_38731979
  1. 海量数据下的分布式存储与计算

  2. 提到大数据存储nosql是不得不提的一个部分,CAP,BASE,ACID这些原理在过去的一些年对其有着一定的指导作用(近年来随着各种实时计算模型的发展,CAP也被渐渐打破)CAP:(Consistency-Availability-Partition Tolerance数据一致性(C):等同于所有节点访问同一份最新的数据副本;对数据更新具备高可用性(A):在可写的时候可读,可读的时候可写,最少的停工时间能容忍网络分区(P)eg:传统数据库一般采用CA即强一致性和高可用性nosql,云存储等一般采
  3. 所属分类:其它

    • 发布日期:2021-01-31
    • 文件大小:245760
    • 提供者:weixin_38666114
« 12 3 4 5 6 7 8 9 10 ... 31 »