开发工具:
文件大小: 24kb
下载次数: 0
上传时间: 2014-09-24
详细说明: Java编辑距离实现 已完成测试 编辑距离(EditDistance)定义字符串的相似度 编辑距离就是用来计算从原串(s)转换到目标串 t 所需要的最少的插入 删除和替换的数目 在NLP中应用比较广泛 如一些评测方法中就用到了(wer mWer等) 同时也常用来计算你对原文本所作的改动数 编辑距离的算法是首先由俄国科学家Levenshtein提出的 故又叫Levenshtein Distance Levenshtein Distance算法可以看作动态规划 它的思路就是从两个字符串的左边开始比较 记录已经比较过的子串相似度 实际上叫做距离 然后进一步得到下一个字符位置时的相似度 用下面的例子: GUMBO和GAMBOL 当算到矩阵D[3 3]位置时 也就是当比较到GUM和GAM时 要从已经比较过的3对子串GU GAM GUM GA和GU GA之中选一个差别最小的来当它的值 所以要从左上到右下构造矩阵 ">Java编辑距离实现 已完成测试 编辑距离(EditDistance)定义字符串的相似度 编辑距离就是用来计算从原串(s)转换到目标串 t 所需要的最少的插入 删除和替换的数目 在NLP中应用比较广泛 如一些评测方法中就用到了 (wer mWer [更多] ...展开收缩
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.