- 浏览: 121817 次
- 性别:
- 来自: HEYUAN
文章分类
最新评论
-
malson:
果然可以了!多谢
关于springmvc 无法使用aop拦截的解决方案 -
1025250620:
如何设置它的淘汰策略~
guava cache 使用
java版编辑距离(字符串相似度)算法 levenshtein (edit distance)
- 博客分类:
- java
/** * levenshtein (edit distance) */ public class SimilarityUtils { private SimilarityUtils(){} public static int ld(String s, String t) { int d[][]; int sLen = s.length(); int tLen = t.length(); int si; int ti; char ch1; char ch2; int cost; if(sLen == 0) { return tLen; } if(tLen == 0) { return sLen; } d = new int[sLen+1][tLen+1]; for(si=0; si<=sLen; si++) { d[si][0] = si; } for(ti=0; ti<=tLen; ti++) { d[0][ti] = ti; } for(si=1; si<=sLen; si++) { ch1 = s.charAt(si-1); for(ti=1; ti<=tLen; ti++) { ch2 = t.charAt(ti-1); if(ch1 == ch2) { cost = 0; } else { cost = 1; } d[si][ti] = Math.min(Math.min(d[si-1][ti]+1, d[si][ti-1]+1),d[si-1][ti-1]+cost); } } return d[sLen][tLen]; } public static double similarity(String src, String tar) { int ld = ld(src, tar); return 1 - (double) ld / Math.max(src.length(), tar.length()); } public static void main(String[] args) { String src = "hello world!"; String tar = "hello"; System.out.println("sim="+SimilarityUtils.similarity(src, tar)); } }
发表评论
-
dom4j UserDataDocumentFactory
2015-03-20 00:30 0package word; import org ... -
java 命令
2014-10-13 09:54 0命令分析: jhat [-stack <b ... -
Httpclient post form
2014-09-26 14:06 0String u = "http:// ... -
java 异常
2014-09-04 15:41 0如果实现了接口,但是接口中的某个方法不需要实现,则抛 ... -
guava 类扫描
2014-06-29 17:10 1418ClassPath classpath = Clas ... -
guava 动态代理
2014-06-29 16:31 981JDK: Foo foo = (Foo) Pro ... -
Guava 异常处理例子
2014-06-29 16:15 1578Closer closer = Closer.cr ... -
JSF Converter-定义通用的 状态 转换器
2014-06-29 11:10 1016创建StatusConverter类: /* ... -
未实现方法抛异常
2014-05-29 16:51 784如果类实现了接口却有部分方法不想实现,则在方法体中抛异常:U ... -
Eclipse RCP 神奇错误,浪费了一天时间.
2014-05-12 00:44 1426错误信息: Internal compiler ... -
在同一linux主机部署多个Tomcat
2013-11-01 12:06 3这里是为tomcat单独配置jdk版本,如果服务器j ... -
MyProgressMonitorDialog
2013-09-28 12:16 959package xxx; import java.l ... -
linux 配置两个Tomcat
2013-06-21 13:42 1195第一个Tomcat使用默认配置 第二个Tomcat ... -
Eclipse RCP
2013-04-30 16:57 835eclipse 运行需要jre,但如果开发的程序要指定某个 ... -
让输出到txt文件中的字符串整齐排列
2013-01-17 13:36 1787让输出到txt文件中的字符串整齐排列 public st ... -
swing jtextarea 自动行高
2013-01-07 14:17 2468哈哈哈.... final JTextArea tex ... -
java WeakReference
2012-11-08 20:49 0http://www.8844.com/article/d/2 ... -
eclipse xml 配置文件
2012-10-21 22:45 2348以下代码源自eclipse org.eclipse.ui.wo ... -
swt
2012-07-28 00:46 891swt/jface api chm格式: http://dl ... -
字符串相似度算法(收藏)
2012-06-30 16:03 0package org.zero.system.stor ...
相关推荐
NULL 博文链接:https://biansutao.iteye.com/blog/326008
Levenshtein算法python也是用的这个对比字符串相似度的,还不错
Levenshtein:快速计算编辑距离以及字符串的相似度
两个字符串的相似度算法实现——编辑距离之Levenshtein距离
C#,字符串相似度的莱文斯坦距离(Levenshtein Distance)算法与源代码 莱文斯坦距离(Levenshtein Distance)用于衡量两个字符串之间的相似度。 莱文斯坦距离以俄国科学家(Vladimir I. Levenshtein)命名,他于...
比较两个字符串的相似度,利用Levenshein算法计算出两个字符串的最小编辑距离,根据最小编辑距离得出相似度,例如: 字符串1:1234 字符串2:51234,则他们的相似度为:4/5。
当前实现了十二种算法(包括Levenshtein编辑距离和同级,Jaro-Winkler,最长公共子序列,余弦相似性等)。 查看下面的摘要表以获取完整列表... 下载 使用Maven: <groupId>info.debatty <artifactId>java-...
目前实现了十几种算法(包括 Levenshtein 编辑距离和兄弟、Jaro-Winkler、最长公共子序列、余弦相似度等)。查看下面的汇总表以获取完整列表... python字符串相似度 下载 概述 归一化、度量、相似性和距离 (归一化...
使用最短编辑距离算法判断两个字符串的相似度
Levenshtein Distance-两字符串相似度计算...
编辑距离(EditDistance)定义 编辑距离就是用来计算从原串(s)转换到目标串(t)所需要的最少的插入,删除和替换的数目,在NLP中...编辑距离的算法是首先由俄国科学家Levenshtein提出的,故又叫Levenshtein Distance。
为此,提出一种基于改进编辑距离的字符串相似度求解算法,对字符串相似度度量公式及Levenshtein矩阵计算方法进行改进。在计算编辑距离时,以原有矩阵求出两字符串的最长公共子串及所有LD回溯路径。选取一个单词作为...
java-string-similarity, 各种字符串相似性和距离算法 java-string-similarity 实现不同字符串相似度和距离度量的库。 目前已经实现了许多算法( 包括Levenshtein编辑距离和 sibblings,jaro winkler,最长公共子序列...
Strutil strutil提供了用于计算字符串相似度的字符串度量标准以及其他字符串实用程序功能。 完整文档可在以下找到: : 。安装 go get github.com/adrg/strutil字符串指标杰罗·温克勒史密斯·沃特曼·高图索伦森-...
余弦相似度算法文本相似度算法的对比及python实现五种常见的相似度算法:余弦相似度(cosine_similarity)、jaccard相似度、编辑距离(Levenshtein)、MinHash、SimHash + 海明距离。
编辑距离算法,即Levenshtein Distance (LD)算法。 这个算法其实是一个动态规划(DP)。levenshtein() 返回两个字符串之间的 Levenshtein 距离。 Levenshtein 距离,又称编辑距离,指的是两个字符串之间,由一个...
当前实现了十二种算法(包括Levenshtein编辑距离和同级,Jaro-Winkler,最长公共子序列,余弦相似性等)。 查看下面的摘要表以获取完整列表... 下载 从pypi: # pip install strsim # deprecated, do not use this...
#region 计算字符串相似度 /// /// 计算字符串相似度 /// /// ”str1″>字符串1 /// ”str2″>字符串2 /// 相似度 public static float Levenshtein(string str1, string str2) {
字符串相似度 根据找到两个字符串之间的相似度,该相似度通常比要好。 目录 用法 对于Node.js 安装使用: npm install string-similarity --save 在您的代码中: var stringSimilarity = require ( "string-...