LD算法的C++实现(基于编辑距离的文本比较算法)
算法看这里:
http://www.cnblogs.com/grenet/archive/2010/06/01/1748448.html
用数组实现:
#include <iostream>
#include <stdio.h>
#include <string>
using namespace std; //LD算法(Levenshtein Distance)又成为编辑距离算法(Edit Distance)。他是以字符串A通过插入字符、删除字符、替换字符变成另一个字符串B,那么操作的过程的次数表示两个字符串的差异。 void cal(int count[][], char s1[], char s2[], int i, int j){ //注意这里:传入二维数组时,最低维必须指定维数!!
if(s1[i]==s2[j]){
count[i][j] = count[i-][j-];
}
else {
int min = count[i-][j-]<count[i-][j] ? count[i-][j-] : count[i-][j];
min = min<count[i][j-] ? min : count[i][j-];
count[i][j] = min+;
}
//cout<<sizeof(count)<<endl; //输出貌似还是4 这就是一个指针的大小了吧?
} int LD(char s1[], char s2[], int len1, int len2){
int i,j; //cout<<strlen(s1)<<strlen(s2)<<endl; //可以得到正确的长度
//cout<<sizeof(s1)<<sizeof(s2)<<endl; //输出一直是4!可能是因为变成了指针?
//cout<<sizeof(s1[0])<<sizeof(s2[0])<<endl;
//cout<<len1<<len2<<endl;
//cout<<s1[0]<<s2[0]<<endl;
//cout<<s1<<s2<<endl;
int count[][]; //声明数组!维数不能是变量!
//int count[len1+1][len2+1]; //这样编译不通过!
for(i=; i<len2+; i++){
count[][i] = i;
}
for(i=;i<len1+;i++){
count[i][] = i;
} for(i=; i<len1+;i++){
for(j=; j<len2+; j++){
cal(count,s1,s2,i,j);
}
}
for(i=;i<len1+;i++){
for(j=;j<len2+;j++){
cout<<count[i][j]<<" ";
}
cout<<endl;
}
return count[len1][len2];
} int main(){ char s1[]; //= "ABSDFADFSF";
char s2[];// = "ASFDSGGGHFH";
while(scanf("%s%s",s1,s2)!=EOF){
int len1 = strlen(s1);
int len2 = strlen(s2);
int result = LD(s1,s2,len1,len2);
cout<<result<<endl;
}
return ; }
LD算法的C++实现(基于编辑距离的文本比较算法)的更多相关文章
- Tone Mapping算法系列一:基于Fast Bilateral Filtering 算法的 High-Dynamic Range(HDR) 图像显示技术。
一.引言 本人初次接触HDR方面的知识,有描述不正确的地方烦请见谅. 为方便文章描述,引用部分百度中的文章对HDR图像进行简单的描述. 高动态范围图像(High-Dynamic Range,简称HDR ...
- 文本比较算法Ⅱ——Needleman/Wunsch算法
在"文本比较算法Ⅰ--LD算法"中介绍了基于编辑距离的文本比较算法--LD算法. 本文介绍基于最长公共子串的文本比较算法--Needleman/Wunsch算法. 还是以实例说明: ...
- JavaScript基于时间的动画算法
转自:https://segmentfault.com/a/1190000002416071 前言 前段时间无聊或有聊地做了几个移动端的HTML5游戏.放在不同的移动端平台上进行测试后有了诡异的发现, ...
- 简单易学的机器学习算法—基于密度的聚类算法DBSCAN
简单易学的机器学习算法-基于密度的聚类算法DBSCAN 一.基于密度的聚类算法的概述 我想了解下基于密度的聚类算法,熟悉下基于密度的聚类算法与基于距离的聚类算法,如K-Means算法之间的区别. ...
- 简单易学的机器学习算法——基于密度的聚类算法DBSCAN
一.基于密度的聚类算法的概述 最近在Science上的一篇基于密度的聚类算法<Clustering by fast search and find of density peaks> ...
- 基于改进人工蜂群算法的K均值聚类算法(附MATLAB版源代码)
其实一直以来也没有准备在园子里发这样的文章,相对来说,算法改进放在园子里还是会稍稍显得格格不入.但是最近邮箱收到的几封邮件让我觉得有必要通过我的博客把过去做过的东西分享出去更给更多需要的人.从论文刊登 ...
- 数学软件 之 基于MATLAB的DFP算法
DFP算法是本科数学系中最优化方法的知识,也是无约束最优化方法中非常重要的两个拟Newton算法之一,上一周写了一周的数学软件课程论文,姑且将DFP算法的实现细节贴出来分享给学弟学妹参考吧,由于博客不 ...
- 最小生成树--Prim算法,基于优先队列的Prim算法,Kruskal算法,Boruvka算法,“等价类”UnionFind
最小支撑树树--Prim算法,基于优先队列的Prim算法,Kruskal算法,Boruvka算法,“等价类”UnionFind 最小支撑树树 前几节中介绍的算法都是针对无权图的,本节将介绍带权图的最小 ...
- 基于MapReduce的SimRank++算法研究与实现
一.算法应用背景 计算广告学(Computational Advertising)是一门广告营销科学,以追求广告投放的收益最大化为目标,重点解决用户与广告匹配的相关性和广告的竞价模型问题,涉及到自然语 ...
随机推荐
- 二叉树的层次遍历 · Binary Tree Level Order Traversal
[抄题]: 给出一棵二叉树,返回其节点值的层次遍历(逐层从左往右访问) [思维问题]: [一句话思路]: 用queue存每一层 [输入量]:空: 正常情况:特大:特小:程序里处理到的特殊情况:异常情况 ...
- sql批量修改字段内容的语句-SQL技巧
--update '表名' set 要修改字段名 = replace (要修改字段名,'被替换的特定字符','替换成的字符')--update tRecord set columnName = rep ...
- [leetcode]318. Maximum Product of Word Lengths单词长度最大乘积
Given a string array words, find the maximum value of length(word[i]) * length(word[j]) where the tw ...
- MVC中构建Linq条件、排序、Selector字段过滤
代码: System.Linq.Expressions.Expression<Func<Domain.S_ROLE, bool>> expressWhere1 = (c =&g ...
- js记录
--获取后缀名,结果 .jpg var extName = "/upload/head_img/20150902102539.jpg";var ta = extName.subst ...
- PAT 1053 住房空置率 (20)(代码+思路)
1053 住房空置率 (20)(20 分) 在不打扰居民的前提下,统计住房空置率的一种方法是根据每户用电量的连续变化规律进行判断.判断方法如下: 在观察期内,若存在超过一半的日子用电量低于某给定的阈值 ...
- HDU_1022
题目: As the new term comes, the Ignatius Train Station is very busy nowadays. A lot of student want t ...
- UI设计,你为什么不能把标题做的更明显呢?
在设计中标题常常被重视,标题即是文案信息的精华提炼,那么如何能把标题在很多文案信息中脱颖而出就是设计师所要做的工作,前面的文章说过对比可以凸显主题,这期是在对比合理的前提下更进一步的处理方法,我们可以 ...
- 开始Java之旅
从今天起,cgg将给大家讲讲Java这种神奇的东西. 至于配置环境变量,大家可以看看我的博客:环境变量上面有详细解释. 下面先给大家一个公式: public class [文件名]{ ...
- 2018.10.23 NOIP模拟 行星通道计划(bit)
传送门 卡常题. 成功卡掉了作死写树套树的zxy. 然而对我的二维bit无能为力. 直接维护两棵bit. bit1[i][j]bit1[i][j]bit1[i][j]表示左端点小于等于iii,右端点小 ...