您好,欢迎光临本网站![请登录][注册会员]  
文件名称: Url消重算法(BloomFilter)
  所属分类: 其它
  开发工具:
  文件大小: 19kb
  下载次数: 0
  上传时间: 2008-02-12
  提 供 者: haid*****
 详细说明: 本程序主要是BloomFilter算法的简化实现
因为C#非安全代码无法直接分配内存块,使用了int型数组代替,暂时为了简单没有使用位运算,比位运算消耗内存多16倍。
算法原理:
其首先申请一块大内存,并把内存中的所有位设置为0。对每一个URL,用10个不同的hash函数计算其hash值,并把这些hash与内存bit数大小取模,把取模后的10个数在内存对应的位置设为1。在设置前会判断该位是否被设置。如果10个hash值对应的bit位全被设置,则认为该URL已存在。该算法在web archive中实现。据其统计,平均为每个URL分配两个字节,可以达到零冲突。
本程序算法:
创建一个大小固定的数组,平均分为8段,前4段存储HASH函数(MD5)URL后的对应值,转换每4个字节为int,以转换后的int%每段数组的元素数,取模后的值对应的位置元素设置为1。后4段存储HASH函数(SHA1)URL后的对应值,具体算法相同。
如果在保存一个URL时,在8段数组中对应位置都已经被置1,则该URL已经存在,如有任意1位置没被置1,则该URL不存在。
(系统自动生成,下载前可以参看下载内容)

下载文件列表

相关说明

  • 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
  • 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度
  • 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
  • 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
  • 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
  • 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.
 输入关键字,在本站1000多万海量源码库中尽情搜索: