horspool算法讲解_string匹配字符串

horspool算法讲解_string匹配字符串Horsepool算法是Boyer-Moore算法的简化版本,这也是一个空间换时间的典型例子。算法把模式P和文本T的开头字符对齐,从模式的最后一个字符开始比较,如果尝试比较失败了,它把模式向后移。每次尝试过程中比较是从右到左的。假设文本中,对齐模式最后一个字符的元素是c,Horspool算法根据c的不同情况来确定移动距离,无论c是否和模式的最后一个字符相匹配。一般来说,会存在下面四种情况。情况1:看

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

Horsepool算法是Boyer-Moore算法的简化版本,这也是一个空间换时间的典型例子。算法把模式P和文本T的开头字符对齐,从模式的最后一个字符开始比较,如果尝试比较失败了,它把模式向后移。每次尝试过程中比较是从右到左的。

假设文本中,对齐模式最后一个字符的元素是c,Horspool算法根据c的不同情况来确定移动距离,无论c是否和模式的最后一个字符相匹配。

一般来说,会存在下面四种情况。

这里写图片描述

情况1:看第一行,模式中不存在c(此时c就是字母A),模式的移动长度就是它的全部长度,移到第二行所示的位置。

情况2:看第二行,c(此时c就是字符O)正好是模式的最后一个字符,但是从右向左比较时,有字符不匹配,比如此时的AE不匹配。而且模式中的其他m-1个字符也不包含c。移动的情况类似情况1,移动的幅度等于模式的全部长度,移到第三行所示的位置。

这里写图片描述
情况3:看第一行,模式中存在c(此时c就是字符L),但是它不是模式的最后一个字符,移动时应该把模式中最右边的c和文本中的c对齐,移到第二行所示的位置。
情况4:看第二行,c(此时c就是字符O)正好是模式的最后一个字符,但是从右向左比较时,有字符不匹配,比如此时的AE不匹配。而此时模式中的其他m-1个字符包含c。移动的情况类似情况3,移动时应该把前m-1个字符中最右边的c和文本中的c对齐,移到第三行所示的位置。

这说明,比起蛮力算法每次总是移动一个位置,从右到左的字符比较使模式模式移动得更远。然而,如果在每次尝试时都必须检查模式中的每个字符,它的优势也会丧失殆尽。我们可以预先算出遇到某个字符要移动的距离,并把它存在一个表中。具体来说,对于每一个字符c,可以通过以下公式算出移动距离:

t(c)={
mm1ccm-1

如对于模式BARBER,移动距离如下表所示:

字符c A B E R 其它字符(包括空格,标点符号,下划线和其它一些特殊字符)
移动距离t(c) 4 2 1 3 6

c++实现

int Horspool(vector<char> & T,vector<char> & P)
{
    int n = T.size();
    int m = P.size();   
    vector<int> table(96,m);//以字母表中可打印字符为索引的数组

    for(int i = 0;i < m - 1;i++)
    {
        table[P[i] - 32] = m - 1 - i;//模式串中每个字符的移动距离,从左至右扫描模式,相同字符的最后一次改写恰好是该字符在模式串的最右边
    }

    int i = m - 1;
    while(i <= n - 1)
    {
        int k = 0;
        while(k <= m - 1 && P[m - 1 - k] == T[i - k])
            k++;

        if(k == m)
            return i - m + 1;//匹配成功,返回索引
        else
            i += table[T[i] - 32];//模式串向右移动
    }

    return -1;//匹配失败
}
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/171722.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • idea2021 激活码-激活码分享[通俗易懂]

    (idea2021 激活码)本文适用于JetBrains家族所有ide,包括IntelliJidea,phpstorm,webstorm,pycharm,datagrip等。https://javaforall.net/100143.htmlIntelliJ2021最新激活注册码,破解教程可免费永久激活,亲测有效,上面是详细链接哦~V…

    2022年3月22日
    72
  • ubuntu18.04安装ROS Melodic(最详细配置)[通俗易懂]

    ubuntu18.04安装ROS Melodic(最详细配置)[通俗易懂]设置软件源:国外的:sudosh-c’echo”debhttp://packages.ros.org/ros/ubuntu$(lsb_release-sc)main”>/etc/apt/sources.list.d/ros-latest.list’国内的,速度快:sudosh-c’./etc/lsb-release&&ec…

    2022年6月14日
    42
  • Origin 2018中文版软件下载和安装教程|兼容Win10(上)

    Origin 2018中文版软件下载和安装教程|兼容Win10(上)

    2022年5月2日
    81
  • Server.MapPath()用法[通俗易懂]

    Server.MapPath()用法[通俗易懂]Server.MapPath(stringpath)作用是返回与Web服务器上的指定虚拟路径相对应的物理文件路径。其参数path为Web服务器的虚拟路径,返回结果是与path相对应的物理文件路径。但有时参数并非为虚拟路径,而是用户自定义的文件名。  Server.MapPath()的全名是System.Web.HttpContext.Current.Server.MapPath()。有

    2022年7月15日
    18
  • 秒懂,Java 注解 (Annotation)你可以这样学

    秒懂,Java 注解 (Annotation)你可以这样学文章开头先引入一处图片。这处图片引自老罗的博客。为了避免不必要的麻烦,首先声明我个人比较尊敬老罗的。至于为什么放这张图,自然是为本篇博文服务,接下来我自会说明。好了,可以开始今天的博文了。Annotation中文译过来就是注解、标释的意思,在Java中注解是一个很重要的知识点,但经常还是有点让新手不容易理解。我个人认为,比较糟糕的技术文档主要特征之一就是:用专业名词来…

    2022年6月10日
    33
  • iot技术_如何帮助阿尔兹海默症

    iot技术_如何帮助阿尔兹海默症场景介绍阿尔茨海默病,是导致中老年人认知功能障碍的最常见疾病之一,是发生在老年期及老年前期的一种原发性退行性脑病。据估计,全世界痴呆症患者数量为4700万,到2030年将达到7500万人。痴呆症患者数量到2050年预计将是现在的近三倍。疾病的高昂费用给卫生系统应对未来预计不断增加的病例构成挑战。据估计,目前每年的支出为8180亿美元,而支出的增长速度预计会比疾病流行率上升还要快。照料痴呆症患者…

    2025年5月28日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号