您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 海量数据处理 海量数据处理

  2. 海量数据是发展趋势,对数据分析和挖掘也越来越重要,从海量数据中提取有用信息重要而紧迫,这便要求处理要准确,精度要高,而且处理时间要短,得到有价值信息要快,所以,对海量数据的研究很有前途,也很值得进行广泛深入的研究。 基于海量数据的数据挖掘正在逐步兴起,面对着超海量的数据,一般的挖掘软件或算法往往采用数据抽样的方式进行处理,这样的误差不会很高,大大提 高了处理效率和处理的成功率。
  3. 所属分类:其它

    • 发布日期:2010-12-20
    • 文件大小:23552
    • 提供者:li1982397940
  1. 海量数据处理算法大集合

  2. 海量日志的查询,海量数据的比较……这篇文档给出了非常完善的总结
  3. 所属分类:其它

    • 发布日期:2011-03-04
    • 文件大小:257024
    • 提供者:lq312658076
  1. 百度、google海量数据搜索算法题解

  2. 列了一些百度、Google海量数据搜索算法的解法。喜欢算法的人以及有心去Google、百度的可以重点参考
  3. 所属分类:其它

    • 发布日期:2011-04-06
    • 文件大小:14336
    • 提供者:zl200972172
  1. 海量数据面试题整理

  2. 整理的一些常见互联网海量数据排序面试题。
  3. 所属分类:数据库

    • 发布日期:2011-10-25
    • 文件大小:114688
    • 提供者:liubo5005
  1. 海量数据处理(超经典)

  2. 包含各种不常见的海量数据处理算法和相应的数据结构。确实是一本好资料啊
  3. 所属分类:C/C++

    • 发布日期:2012-05-29
    • 文件大小:3145728
    • 提供者:hongtu621
  1. 常用大数据量,海量数据处理方法,算法总结

  2. 常用大数据量,海量数据处理方法,算法总结,非常好的书。
  3. 所属分类:Java

    • 发布日期:2012-06-26
    • 文件大小:24576
    • 提供者:xaccpj2ee
  1. 常用大数据量、海量数据处理方法 (算法)总结

  2. 常用大数据量、海量数据处理方法 (算法)总结
  3. 所属分类:其它

    • 发布日期:2013-01-06
    • 文件大小:24576
    • 提供者:bbsforum
  1. 海量数据算法

  2. 海量数据算法 公司面试的实用算法 百度 谷歌等互联网公司
  3. 所属分类:C

    • 发布日期:2013-07-23
    • 文件大小:30720
    • 提供者:xiaoshubiao
  1. 海量数据处理

  2. 海量数据处理相关 所谓海量数据处理,是指基于海量数据的存储、处理、和操作。正因为数据量太大,所以导致要么无 法在较短时间内迅速解决,要么无法一次性装入内存。 事实上,针对时间问题,可以采用巧妙的算法搭配合适的数据结构(如布隆过滤器、哈希、位图、堆、 数据库、倒排索引、Trie 树)来解决;而对于空间问题,可以采取分而治之(哈希映射)的方法,也就是 说,把规模大的数据转化为规模小的,从而各个击破。 此外,针对常说的单机及集群问题,通俗来讲,单机就是指处理装载数据的机器有限(只要考虑 CPU、 内
  3. 所属分类:其它

    • 发布日期:2014-08-28
    • 文件大小:932864
    • 提供者:yangdedipan1234
  1. 99%的海量数据处理面试题

  2. 99%的海量数据处理面试题 作者:July 出处:结构之法算法之道blog
  3. 所属分类:网络基础

    • 发布日期:2014-10-15
    • 文件大小:314368
    • 提供者:burncom
  1. 常用大数据量、海量数据处理方法__算法总结

  2. 大数据量的问题是很多面试笔试中经常出现的问题,比如百度,谷歌,腾讯这样的一些涉及到海量数据的公司经常会问到。 本文的一些问题基本直接来源于公司的面试笔试题目。包括Bloom filter,Hashing,bit-map,双层桶划分,倒排索引等。
  3. 所属分类:算法与数据结构

    • 发布日期:2019-03-16
    • 文件大小:83968
    • 提供者:bnpower
  1. C++算法之海量数据处理方法的总结分析

  2. 本篇文章是对海量数据处理方法进行了详细的总结与分析,需要的朋友参考下
  3. 所属分类:其它

    • 发布日期:2020-09-05
    • 文件大小:49152
    • 提供者:weixin_38625164
  1. php 大数据量及海量数据处理算法总结

  2. 大数据量的问题是很多面试笔试中经常出现的问题,比如baidu google 腾讯 这样的一些涉及到海量数据的公司经常会问到
  3. 所属分类:其它

    • 发布日期:2020-10-28
    • 文件大小:112640
    • 提供者:weixin_38681628
  1. C++算法之海量数据处理方法的总结分析

  2. 海量数据处理中常用到的技术 1. Bloom Filtering基本的Bloom Filtering支持快速的插入和查找操作,是一种hash表技术。基本的数据结构非常简单,容量为m的位数组,k个hash函数,将输入的n个元素存储在位数组里面。每次插入一个新的元素,先计算该元素的k个hash指,将位数组对应hash值位置为1. 查找某个元素时,同样的先计算k个hash值,然后查询看是否对应位数组中得k位是否都是1,是则断定元素存在。基本的Bloom Filtering算法可以用于允许误差的快速判重
  3. 所属分类:其它

    • 发布日期:2020-12-31
    • 文件大小:55296
    • 提供者:weixin_38659374
  1. 基于MapReduce的海量数据贝叶斯网络学习方法

  2. 贝叶斯网络(BN)是用于表示和推断不确定知识的流行且重要的概率图形模型。 从海量数据中学习BN是不确定性以知识为中心的推理,预测和决策的基础。 海量数据的固有特性使BN学习可以适应大数据量并并行执行。 在本文中,我们提出了一种基于MapReduce的方法,通过扩展传统的评分和搜索算法来从海量数据中学习BN。 首先,在评分过程中,我们开发了map和reduce算法以并行获取所需参数。 其次,在搜索过程中,我们为每个节点开发了map和reduce算法,以并行对所有候选局部结构评分,并选择得分最高的局
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:175104
    • 提供者:weixin_38649315
  1. 海量数据中的机会投影挖掘算法

  2. 当前,已经提出了许多挖掘算法,仅小数据集挖掘和稀疏数据集,遇到海量数据集和密集数据集趋于崩溃。 本文通过频繁模式树模型为海量数据挖掘机会投影集提供了一种支持,以构建一种新的算法OP。 OP与以前的算法完全不同,使用新模型支持两种投影方法:基于投影的虚拟树表示,基于未过滤的投影数组表示,不仅时间效率特别高,而且特别节省了存储空间。 最后,通过Apriori,FP-Gorwth和H-Mnie的对比实验的文章证实了各种OP数据库的大小和特征挖掘效率和可伸缩性是最好的。
  3. 所属分类:其它

    • 发布日期:2021-03-05
    • 文件大小:416768
    • 提供者:weixin_38622149
  1. 9月:一种针对海量数据的有效天际线联接算法

  2. 9月:一种针对海量数据的有效天际线联接算法
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:1048576
    • 提供者:weixin_38626984
  1. 海量数据解决思路之Hash算法

  2. 本文将粗略讲述一下Hash算法的概念特性,里边会结合分布式系统负载均衡实例对Hash的一致性做深入探讨。另外,探讨一下Hash算法在海量数据处理方案中的通用性。最后,从源代码出发,具体分析一下Hash算法在MapReduce框架的中的应用。Hash可以通过散列函数将任意长度的输入变成固定长度的输出,也可以将不同的输入映射成为相同的相同的输出,而且这些输出范围也是可控制的,所以起到了很好的压缩映射和等价映射功能。这些特性被应用到了信息安全领域中加密算法,其中等价映射这一特性在海量数据解决方案中起到
  3. 所属分类:其它

    • 发布日期:2021-03-01
    • 文件大小:598016
    • 提供者:weixin_38710781
  1. PAA:海量数据上一种有效的近似聚集查询算法

  2. 聚集查询是一种常用但是耗时的数据库操作.相对于准确查询,以少得多的响应时间向用户返回满足置信区间的近似结果通常是一种更好的选择.现有的近似查询方法无法在海量数据上高效地处理满足任意精度的近似聚集查询.提出一种新的算法PAA(partition-based approximate aggregation)来有效处理满足任意置信区间的近似聚集.维属性的数据空间被划分为同样大小的空间区域,每个分片维护着维属性落入对应空间区域的元组.PAA算法维护表的随机样本RS,其执行包括两个阶段.在阶段1,如果利用
  3. 所属分类:其它

    • 发布日期:2021-02-10
    • 文件大小:2097152
    • 提供者:weixin_38504417
  1. 海量数据解决思路之Hash算法

  2. 本文将粗略讲述一下Hash算法的概念特性,里边会结合分布式系统负载均衡实例对Hash的一致性做深入探讨。另外,探讨一下Hash算法在海量数据处理方案中的通用性。最后,从源代码出发,具体分析一下Hash算法在MapReduce框架的中的应用。Hash可以通过散列函数将任意长度的输入变成固定长度的输出,也可以将不同的输入映射成为相同的相同的输出,而且这些输出范围也是可控制的,所以起到了很好的压缩映射和等价映射功能。这些特性被应用到了信息安全领域中加密算法,其中等价映射这一特性在海量数据解决方案中起到
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:598016
    • 提供者:weixin_38620741
« 12 3 4 5 6 7 8 9 10 ... 29 »