您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Similarity Search- The Metric Space Approach

  2. Part I Metric Searching in a Nutshell Overview 3 1. FOUNDATIONS OF METRIC SPACE SEARCHING 5 1 The Distance Searching Problem 6 2 The Metric Space 8 3 Distance Measures 9 3.1 Minkowski Distances 10 3.2 Quadratic Form Distance 11 3.3 Edit Distance 12
  3. 所属分类:Access

    • 发布日期:2009-07-11
    • 文件大小:11534336
    • 提供者:musicbug
  1. 文本相似度计算--余弦定理和广义Jaccard系数

  2. 网上找的资源,给大家共享一下。 文本相似度计算--余弦定理和广义Jaccard系数
  3. 所属分类:专业指导

    • 发布日期:2010-01-27
    • 文件大小:3072
    • 提供者:sccgood
  1. 字符串近似匹配 源代码 linux

  2. 数据库相关作业 实现字符串近似匹配 gcc平台下C++编写 所谓近似匹配,由编辑距离和Jaccard距离计算所得
  3. 所属分类:C/C++

    • 发布日期:2011-11-23
    • 文件大小:3072
    • 提供者:happylily2008
  1. 数据库 近似查询

  2. 数据库 近似查询的实现,采用jaccard和ED两种方法实现。用的q-gram来分词。考虑到了重复的情况
  3. 所属分类:数据库

    • 发布日期:2013-02-23
    • 文件大小:9216
    • 提供者:yhhong3
  1. bioinformatic similarity mehtod using python(cosin, jaccard...)

  2. python 编写 cosin jaccard and smith-waterman函数
  3. 所属分类:专业指导

    • 发布日期:2013-06-04
    • 文件大小:2048
    • 提供者:yanfendai
  1. 去重算法Similarity

  2. 实现了SimHash算法、MinHash算法、Shingling算法、汉明距离、Jaccard Index。供初学者参考
  3. 所属分类:Java

    • 发布日期:2013-07-12
    • 文件大小:15360
    • 提供者:sssummering114
  1. Jaccard Index算法,可用数据库传值

  2. 用Jaccard Index算法可实现字符串相似性的比价,该文档可以实现用数据库传送字符串进行大规模的数据相似性比较
  3. 所属分类:C/C++

    • 发布日期:2014-12-16
    • 文件大小:4096
    • 提供者:haha_comeon
  1. secondstring

  2. secondstring 用于计算jaccard相似度
  3. 所属分类:其它

    • 发布日期:2015-03-15
    • 文件大小:201728
    • 提供者:zyj19920216
  1. 凝聚型层次聚类的matlab代码

  2. 代码说明 代码仅供学习研究,未经允许,请勿擅自商用。 1.输入文件格式 输入的文件要求为N行两列的形式,两列分别对应,输入数据点的X轴坐标和Y轴坐标。 输入文件格式示例如下: 0.821794 -0.0462153 1.03929 0.060835 1.12046 0.0745568 1.02233 0.0514739 2.代码支持的凝聚层次聚类算法 通过简要的修改代码中函数的参数,代码可以支持不同的凝聚方法,支持的凝聚方法如下,默认的为代码本身算法: 单连接算法(默认,最近邻聚类算法,最短距
  3. 所属分类:数据库

    • 发布日期:2015-06-10
    • 文件大小:335872
    • 提供者:mxlm*w
  1. 新闻标题Jaccard相似度数据

  2. https://blog.csdn.net/weixin_40422121/article/details/105640509 博客所需数据
  3. 所属分类:算法与数据结构

    • 发布日期:2020-04-20
    • 文件大小:13312
    • 提供者:weixin_40422121
  1. matlab开发-JACCARD效率和理想化

  2. matlab开发-JACCARD效率和理想化。计算JACCard系数和共现矩阵
  3. 所属分类:其它

    • 发布日期:2019-08-24
    • 文件大小:2048
    • 提供者:weixin_38743481
  1. Python 实现Jaccard相似度计算,判断英文新闻标题相似度

  2. 相似文档检测 Mission data.csv中包含了一个新闻标题列表,试通过近似检测方法,通过Jaccard相似度,检测相似文章,将结果保存到csv文件中,不同文章间用空行隔开。 Work 思路: 两个词作为一段来计算,末尾不够截掉 Jaccard相关系数大于0.5则认为两个新闻标题相似 利用并查集将相似的合并在一起 Code import pandas as pd import nltk import numpy as np class Jaccard: def __init__(s
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:39936
    • 提供者:weixin_38672840
  1. Python 实现Jaccard相似度计算,判断英文新闻标题相似度

  2. 相似文档检测 Mission data.csv中包含了一个新闻标题列表,试通过近似检测方法,通过Jaccard相似度,检测相似文章,将结果保存到csv文件中,不同文章间用空行隔开。 Work 思路: 两个词作为一段来计算,末尾不够截掉 Jaccard相关系数大于0.5则认为两个新闻标题相似 利用并查集将相似的合并在一起 Code import pandas as pd import nltk import numpy as np class Jaccard: def __init__(s
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:39936
    • 提供者:weixin_38647039
  1. 基于扩展Jaccard系数的Java程序聚类研究

  2. 基于扩展Jaccard系数的Java程序聚类研究
  3. 所属分类:其它

    • 发布日期:2021-03-19
    • 文件大小:512000
    • 提供者:weixin_38656103
  1. 基于巴氏系数和Jaccard 系数的协同过滤算法

  2. 基于巴氏系数和Jaccard 系数的协同过滤算法
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:611328
    • 提供者:weixin_38614268
  1. 基于改进的Jaccard系数文档相似度计算方法

  2. 文本相似度主要应用于学术论文查重检测、搜索引擎去重等领域, 而传统的文本相似度计算方法中的特征.项提取与分词环节过于冗杂, 而且元素的随机挑选也会产生权重的不确定性. 为了解决传统方法的不足, 提出一种.基于改进的 Jaccard 系数确定文档相似度的方法, 该算法综合考虑了各元素、样本在文档中的权重及其对多个文档.相似度的贡献程度. 实验结果表明, 基于改进的 Jaccard 系数的文档相似度算法具有实效性并且能够得到较高的准.确率, 适用于各种长度的中英文文档, 有效地解决现有技术中存在的文
  3. 所属分类:其它

    • 发布日期:2021-02-07
    • 文件大小:902144
    • 提供者:weixin_38623819
  1. 实验室生物信息学:大学工作。 适用于长DNA序列的近似比对仪。 通过最小化器和MinHash从k-mers估计Jaccard相似度,然后将其用作序列身份代理-源码

  2. 将长读映射到大型参考数据库 这是FER( )上的生物信息学课程的一个项目。 描述实现算法的论文可以在 找到,其C ++实现。 随着作者对算法的改进,C ++实现似乎与本文的描述有所不同。 安装 该程序的依赖项全部捆绑在./pom.xml ,因此将自动下载。 您只需要在计算机上安装Maven。 从项目根目录运行mvn package应该足以将程序安装在./target下。 运行程序 该程序需要两个参数,即FASTA文件格式的引用和查询(提供的FASTA文件不应包含任何注释)。 您可以通过发出
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:1048576
    • 提供者:weixin_42153793
  1. probminhash:ProbMinHash –用于(概率)Jaccard相似度的一类局部敏感哈希算法-源码

  2. ProbMinHash –用于(概率)Jaccard相似度的一类局部敏感哈希算法 带有标签的修订版用于生成最终论文中提出的结果,该论文可在上获得,或在以下网站上找到arXiv-preprint: 。 除了在本文所提出的算法, 包含算法NonStreamingProbMinHash2和NonStreamingProbMinHash4 ,其非流的等价变体ProbMinHash2和ProbMinHash4 。 在第一遍中,他们计算所有权重的总和,从而确定最终止损极限的分布。 这允许预先估计适当的停
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:5242880
    • 提供者:weixin_42168830
  1. Java字符串相似度:各种字符串相似度和距离算法的实现:Levenshtein,Jaro-winkler,n-Gram,Q-Gram,Jaccard索引,最长公共子序列编辑距离,余弦相似度..-源码

  2. Java字符串相似度 一个实现不同字符串相似度和距离度量的库。 当前实现了十二种算法(包括Levenshtein编辑距离和同级,Jaro-Winkler,最长公共子序列,余弦相似性等)。 查看下面的摘要表以获取完整列表... 下载 使用Maven: info.debatty java-string-similarity RELEASE 或检查。 该库需要Java 8或更高版本。 总览 下面介绍了每种已实现算法的主要特征。 “成本”列给出了计算成本的估算值,以分别
  3. 所属分类:其它

    • 发布日期:2021-02-02
    • 文件大小:473088
    • 提供者:weixin_42126668
  1. document_similarity_algorithms_experiments:文档相似性算法实验-Jaccard,TF-IDF,Doc2vec,USE和BERT-源码

  2. 文档相似度算法实验 使用5种流行算法进行文档相似性比较:Jaccard,TF-IDF,Doc2vec,USE和BERT。 该实验使用了33,914篇《纽约时报》的文章。 它旨在显示哪种算法在2020年开箱即用地产生最佳结果。 目的 通过运行多种算法,其中一些算法在NLP社区中是最新的和最新的,它将显示出哪种算法给出了最佳结果,以及对同一组数据给出了多少结果。 通过使用流行的全长媒体出版物作为我们的数据输入,我们将模拟现实世界中的相似性/推荐用例。 通过跟踪URL,您实际上可以自己查看和比较
  3. 所属分类:其它

    • 发布日期:2021-01-31
    • 文件大小:25600
    • 提供者:weixin_42144086
« 12 3 4 »