网络编程 | 站长之家 | 网页制作 | 图形图象 | 操作系统 | 冲浪宝典 | 软件教学 | 网络办公 | 邮件系统 | 网络安全 | 认证考试 | 系统进程
Firefox | IE | Maxthon | 迅雷 | 电驴 | BitComet | FlashGet | QQ | QQ空间 | Vista | 输入法 | Ghost | Word | Excel | wps | Powerpoint
asp | .net | php | jsp | Sql | c# | Ajax | xml | Dreamweaver | FrontPages | Javascript | css | photoshop | fireworks | Flash | Cad | Discuz!
当前位置 > 网站建设学院 > 网络编程 > C/C++
Tag:注入,存储过程,分页,安全,优化,xmlhttp,fso,jmail,application,session,防盗链,stream,无组件,组件,md5,乱码,缓存,加密,验证码,算法,cookies,ubb,正则表达式,水印,索引,日志,压缩,base64,url重写,上传,控件,Web.config,JDBC,函数,内存,PDF,迁移,结构,破解,编译,配置,进程,分词,IIS,Apache,Tomcat,phpmyadmin,Gzip,触发器,socket
网络编程:ASP教程,ASP.NET教程,PHP教程,JSP教程,C#教程,数据库,XML教程,Ajax,Java,Perl,Shell,VB教程,Delphi,C/C++教程,软件工程,J2EE/J2ME,移动开发
本月文章推荐
.C++中理解“传递参数”和异常之间.
.C语言程序设计基础讲座之指针的慨.
.gdb使用.
..
.C语言入门之函数(2).
.根据身份证判断性别和生日.
.References and arrays.
.初学者编程入门:C++实用技巧讲解.
.Windows Socket1.1 程序设计.
.几个图形(02).
.控制台窗口界面的编程控制(二).
.C++指针直接调用类成员函数探讨.
.C++ 虚基类.
.查找某条命令的相关库文件.
.C语言常量与变量.
.编译器对标准库优化小测试.
.跳动的小球.
.C语言运算符.
.使用 C++ Builder&nbs.
.漫话程序设计语言的进化.

字符串近似匹配算法

发表日期:2008-3-8



  字符串的近似匹配,就是答应在匹配时有一定的误差,比如在字串“以前高手好久不见”中找“以前是高手”也能成功。具体地说,错误可以有三种类型:加字符(以前也是高手)、漏字符(以前高手)和替换字符(以前石膏手)。下面的函数在text中查找子串pat,最多答应有k个错误。返回的是匹配的终点(我还没想好如何确定起点,呵呵)。
至于算法的原理,现在一下子说不清楚,只能说这是一个非确定性有限自动机,以后有时间的话再具体介绍。有爱好的话可以自己去看文章《Faster Approximate String Matching》, Algorithmica (1999) 23: 127-158。

算法的限制:(m-k)*(k+2) <= 64, 这里m是子串的长度。那个64是因为哦用了64位整数来编码自动机的状态。假如答应两个错误,则子串最长为18个字符,对一般应用来说足够了。

好了,废话少说,看算法吧。看不懂?没事了,哦也是半懂半不懂的。

char* amatch(const char* text, const char* pat, int k)
{
  int m = strlen(pat);
  assert(m-k>0);
  assert((m-k)*(k+2)<= 64);
  int j;
  __int64 Din = 0;
  __int64 M1 = 0;
  __int64 M2 = 0;
  __int64 M3 = 0;
  __int64 G = 1 << k;
  int onekp1 = (1 << (k+1)) - 1;
  for (j=0; j<m-k; j++)
  {
    Din = (Din << (k+2))onekp1;
    M1 = (M1 << (k+2))1;
    if (j < m-k-1)
      M2 = (M2 << (k+2)) 1;
  }
  M2=(M2<<(k+2))onekp1;
  __int64 D=Din;
  const char* s=text;
  int c=*s++;
  while(c)
  {
    int found=0;
    const char* sp=pat;
    for(j=0;j<k+1;j++)
    {
      int cp=*sp++;
      if(c==cp)
      {
        found=1;
        break;
      }
    }
    if(found)
    {
      do
      {
        __int64 tc = 0;
        const char* sp = pat;
        for (j=0; j<m; j++)
        {
          int cp = *sp++;
          if (c!=cp)
          c=(1<<j);
        }
        __int64 Tc = 0;
        for (j=0; j<m-k; j++)
        Tc = (Tc<<(k+2))((tc>>j)&onekp1);
        __int64 x = (D>>(k+2))Tc;
        D=((D<<1)M1)&((D<<(k+3))M2)&(((x+M1)^x)>>1)&Din;
        if((D & G) == 0)
          return (char*)s;
        if(D != Din)
          c = *s++;
      }
      while ( D != Din && c);
   }
   if (c)
     c = *s++;
}
return NULL;


上一篇:函数调用,__stdcall,__cdecl,__fastcall,thiscall,naked call,__pascal 人气:821
下一篇:玩转BCB的IDE,体验ToolsAPI 人气:547
浏览全部C/C++的内容 Dreamweaver插件下载 网页广告代码 祝你圣诞节快乐 2009年新年快乐