您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. simhash算法库simhash.zip

  2. 专门针对中文文档的simhash算法库 简介 此项目用来对中文文档计算出对应的 simhash 值。 simhash 是谷歌用来进行文本去重的算法,现在广泛应用在文本处理中。 详见SimhashBlog 特性 使用 CppJieba 作为分词器和关键词抽取器 使用 jenkins 作为 hash 函数 hpp 风格,所有源码都是 .hpp 文件里面,方便使用。 没有链接,就没有伤害。 依赖 g (version >= 4.1 recommended), or clang
  3. 所属分类:其它

    • 发布日期:2019-07-16
    • 文件大小:4194304
    • 提供者:weixin_39840650
  1. simhash:中文文档simhash值计算-源码

  2. 专门针对中文文档的simhash算法库 简介 此项目用来对中文文档计算出对应的simhash值。simhash是谷歌用来进行文本去重的算法,现在广泛应用在文本处理中。 详见 特性 使用作为分词器和关键字抽取器 使用作为hash函数 hpp风格,所有源码都是.hpp文件里面,方便使用。没有链接,就没有伤害。 本项目的副产品项目: 提供了简单的simhash HTTP服务。 依赖 g ++(建议版本> = 4.1)或clang ++。 用法 mkdir build cd build cmake
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:4194304
    • 提供者:weixin_42110038