您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. python实现simhash算法实例

  2. Simhash的算法简单的来说就是,从海量文本中快速搜索和已知simhash相差小于k位的simhash集合,这里每个文本都可以用一个simhash值来代表,一个simhash有64bit,相似的文本,64bit也相似,论文中k的经验值为3。该方法的缺点如优点一样明显,主要有两点,对于短文本,k值很敏感;另一个是由于算法是以空间换时间,系统内存吃不消。 复制代码 代码如下:#!/usr/bin/python# coding=utf-8class simhash:    #构造函数    def
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:81920
    • 提供者:weixin_38521169