您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. c#字符串相似度源码 编辑距离 余弦相似性 SimHash

  2. C#源码,演示字符串相似度 编辑距离 余弦相似性 SimHash算法
  3. 所属分类:C#

    • 发布日期:2018-05-22
    • 文件大小:27262976
    • 提供者:qq_29577295
  1. Java编写多个爬虫实例

  2. Java爬虫实例类说明如下: DownLoadFile 文件下载 HtmlParserTool Html解析 MyCrawler 爬虫 ConsistentHash 一致性Hash WordCount Map-Reduce算法例子 Retrive 文件下载 IP 获得IP地址示例 ip QQ纯真数据库示例 HtmlParser 网页内容提取库HtmlParser的源码项目 nekohtml-1.9.7 nekohtml的源码项目 RhinoTest 测试js解析 ExtractContext
  3. 所属分类:Java

    • 发布日期:2018-08-29
    • 文件大小:90177536
    • 提供者:weixin_42404454
  1. simhash算法库simhash.zip

  2. 专门针对中文文档的simhash算法库 简介 此项目用来对中文文档计算出对应的 simhash 值。 simhash 是谷歌用来进行文本去重的算法,现在广泛应用在文本处理中。 详见SimhashBlog 特性 使用 CppJieba 作为分词器和关键词抽取器 使用 jenkins 作为 hash 函数 hpp 风格,所有源码都是 .hpp 文件里面,方便使用。 没有链接,就没有伤害。 依赖 g (version >= 4.1 recommended), or clang
  3. 所属分类:其它

    • 发布日期:2019-07-16
    • 文件大小:4194304
    • 提供者:weixin_39840650
  1. SimHash源码.docx

  2. SimHash源码.docx
  3. 所属分类:Java

    • 发布日期:2020-05-27
    • 文件大小:17408
    • 提供者:Us006124
  1. simhash源码

  2. simhash源码
  3. 所属分类:Python

    • 发布日期:2017-01-12
    • 文件大小:4096
    • 提供者:lafeedfh
  1. DuplicateChecking:基于Simhash的论文查重系统-源码

  2. DuplicateChecking:基于Simhash的论文查重系统
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:32505856
    • 提供者:weixin_42123456
  1. 重复问题检测lsh:通过数据分析(包括局部敏感哈希(LSH))进行知识提取-源码

  2. 重复问题检测 通过数据分析(包括局部敏感哈希(LSH))进行知识提取。 该存储库包含一个Jupyter笔记本,该笔记本使用数据集的子集测试4种不同类型的知识提取。 测试的知识提取方法为: 使用余弦相似度的“一对VS全部” 使用Jaccard相似度的“一对多” 具有余弦相似度的SimHash和随机二元投影的LSH 具有Jashcard相似性的具有MinHash和随机置换函数的LSH
  3. 所属分类:其它

    • 发布日期:2021-03-02
    • 文件大小:220160
    • 提供者:weixin_42098830
  1. simhash:中文文档simhash值计算-源码

  2. 专门针对中文文档的simhash算法库 简介 此项目用来对中文文档计算出对应的simhash值。simhash是谷歌用来进行文本去重的算法,现在广泛应用在文本处理中。 详见 特性 使用作为分词器和关键字抽取器 使用作为hash函数 hpp风格,所有源码都是.hpp文件里面,方便使用。没有链接,就没有伤害。 本项目的副产品项目: 提供了简单的simhash HTTP服务。 依赖 g ++(建议版本> = 4.1)或clang ++。 用法 mkdir build cd build cmake
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:4194304
    • 提供者:weixin_42110038
  1. 相似度:相似度:相似度计算工具包,java编写。用于词,短语,句子,词法分析,情感分析,语义分析等相关的相似度计算-源码

  2. 相似 适用词,语法,句子,词法分析,情感分析,语义分析等相关的相似度计算。 相似度是由一系列算法组成的Java版相似度计算工具包,目标是传播自然语言处理中相似度计算方法。相似度是工具实用,性能高效,架构清晰,语料时新,可自定义的特点。 相似性提供下列功能: 词相似度计算 词林编码法相似度 汉语语义法相似度 知网词相似度 字面编辑距离法 初步相似度计算 简单而言相似度 句子相似度计算 词性和词序结合法 编辑距离算法 Gregor编辑距离法 优化编辑距离法 文本相似度计算 余弦相似度 编辑距离算
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:23068672
    • 提供者:weixin_42139357