java Pattern和Matcher详解

java Pattern和Matcher详解结论 Pattern 与 Matcher 一起合作 Matcher 类提供了对正则表达式的分组支持 以及对正则表达式的多次匹配支持 单独用 Pattern 只能使用 Pattern matcher Stringregex CharSequence 一种最基础最简单的匹配 java 正则表达式通过 java util regex 包下的 Pattern 类与 Matcher 类实现 建议在阅读本

结论:Pattern与Matcher一起合作.Matcher类提供了对正则表达式的分组支持,以及对正则表达式的多次匹配支持. 单独用Pattern只能使用Pattern.matcher(String regex,CharSequence input)一种最基础最简单的匹配。



java正则表达式通过java.util.regex包下的Pattern类与Matcher类实现(建议在阅读本文时,打开java API文档,当介绍到哪个方法时,查看java API中的方法说明,效果会更佳). 

Pattern类用于创建一个正则表达式,也可以说创建一个匹配模式,它的构造方法是私有的,不可以直接创建,但可以通过Pattern.complie(String regex)简单工厂方法创建一个正则表达式, 

Java代码示例: 
Pattern p=Pattern.compile(“\\w+”); 
p.pattern();//返回 \w+ 

pattern() 返回正则表达式的字符串形式,其实就是返回Pattern.complile(String regex)的regex参数 

1.Pattern.split(CharSequence input) 
Pattern有一个split(CharSequence input)方法,用于分隔字符串,并返回一个String[],我猜String.split(String regex)就是通过Pattern.split(CharSequence input)来实现的. 
Java代码示例: 
Pattern p=Pattern.compile(“\\d+”); 
String[] str=p.split(“我的是:我的电话是:0我的邮箱是:”); 

结果:str[0]=”我的是:” str[1]=”我的电话是:” str[2]=”我的邮箱是:” 

2.Pattern.matcher(String regex,CharSequence input) 是一个静态方法,用于快速匹配字符串,该方法适合用于只匹配一次,且匹配全部字符串. 
Java代码示例: 
Pattern.matches(“\\d+”,”2223″);//返回true 
Pattern.matches(“\\d+”,”2223aa”);//返回false,需要匹配到所有字符串才能返回true,这里aa不能匹配到 
Pattern.matches(“\\d+”,”22bb23″);//返回false,需要匹配到所有字符串才能返回true,这里bb不能匹配到 

3.Pattern.matcher(CharSequence input) 
说了这么多,终于轮到Matcher类登场了,Pattern.matcher(CharSequence input)返回一个Matcher对象. 
Matcher类的构造方法也是私有的,不能随意创建,只能通过Pattern.matcher(CharSequence input)方法得到该类的实例. 
Pattern类只能做一些简单的匹配操作,要想得到更强更便捷的正则匹配操作,那就需要将Pattern与Matcher一起合作.Matcher类提供了对正则表达式的分组支持,以及对正则表达式的多次匹配支持. 
Java代码示例: 
Pattern p=Pattern.compile(“\\d+”); 
Matcher m=p.matcher(“22bb23”); 

m.pattern();//返回p 也就是返回该Matcher对象是由哪个Pattern对象的创建的 

4.Matcher.matches()/ Matcher.lookingAt()/ Matcher.find() 
Matcher类提供三个匹配操作方法,三个方法均返回boolean类型,当匹配到时返回true,没匹配到则返回false 

matches()对整个字符串进行匹配,只有整个字符串都匹配了才返回true 
Java代码示例: 
Pattern p=Pattern.compile(“\\d+”); 
Matcher m=p.matcher(“22bb23”); 
m.matches();//返回false,因为bb不能被\d+匹配,导致整个字符串匹配未成功. 
Matcher m2=p.matcher(“2223”); 
m2.matches();//返回true,因为\d+匹配到了整个字符串 

我们现在回头看一下Pattern.matcher(String regex,CharSequence input),它与下面这段代码等价 
Pattern.compile(regex).matcher(input).matches() 

lookingAt()对前面的字符串进行匹配,只有匹配到的字符串在最前面才返回true 
Java代码示例: 
Pattern p=Pattern.compile(“\\d+”); 
Matcher m=p.matcher(“22bb23”); 
m.lookingAt();//返回true,因为\d+匹配到了前面的22 
Matcher m2=p.matcher(“aa2223”); 
m2.lookingAt();//返回false,因为\d+不能匹配前面的aa 

find()对字符串进行匹配,匹配到的字符串可以在任何位置. 
Java代码示例: 
Pattern p=Pattern.compile(“\\d+”); 
Matcher m=p.matcher(“22bb23”); 
m.find();//返回true 
Matcher m2=p.matcher(“aa2223”); 
m2.find();//返回true 
Matcher m3=p.matcher(“aa2223bb”); 
m3.find();//返回true 
Matcher m4=p.matcher(“aabb”); 
m4.find();//返回false 

5.Mathcer.start()/ Matcher.end()/ Matcher.group() 
当使用matches(),lookingAt(),find()执行匹配操作后,就可以利用以上三个方法得到更详细的信息. 
start()返回匹配到的子字符串在字符串中的索引位置. 
end()返回匹配到的子字符串的最后一个字符在字符串中的索引位置. 
group()返回匹配到的子字符串 
Java代码示例: 
Pattern p=Pattern.compile(“\\d+”); 
Matcher m=p.matcher(“aaa2223bb”); 
m.find();//匹配2223 
m.start();//返回3 
m.end();//返回7,返回的是2223后的索引号 
m.group();//返回2223 

Mathcer m2=p.matcher(“2223bb”); 
m2.lookingAt();   //匹配2223 
m2.start();   //返回0,由于lookingAt()只能匹配前面的字符串,所以当使用lookingAt()匹配时,start()方法总是返回0 
m2.end();   //返回4 
m2.group();   //返回2223 

Matcher m3=p.matcher(“2223”); //如果Matcher m3=p.matcher(“2223bb”); 那么下面的方法出错,因为不匹配返回false
m3.matches();   //匹配整个字符串 
m3.start();   //返回0
m3.end();   //返回3,原因相信大家也清楚了,因为matches()需要匹配所有字符串 
m3.group();   //返回2223

说了这么多,相信大家都明白了以上几个方法的使用,该说说正则表达式的分组在java中是怎么使用的. 
start(),end(),group()均有一个重载方法它们是start(int i),end(int i),group(int i)专用于分组操作,Mathcer类还有一个groupCount()用于返回有多少组. 
Java代码示例: 
Pattern p=Pattern.compile(“([a-z]+)(\\d+)”); 
Matcher m=p.matcher(“aaa2223bb”); 
m.find();   //匹配aaa2223 
m.groupCount();   //返回2,因为有2组 
m.start(1);   //返回0 返回第一组匹配到的子字符串在字符串中的索引号 
m.start(2);   //返回3 
m.end(1);   //返回3 返回第一组匹配到的子字符串的最后一个字符在字符串中的索引位置. 
m.end(2);   //返回7 
m.group(1);   //返回aaa,返回第一组匹配到的子字符串 
m.group(2);   //返回2223,返回第二组匹配到的子字符串 

现在我们使用一下稍微高级点的正则匹配操作,例如有一段文本,里面有很多数字,而且这些数字是分开的,我们现在要将文本中所有数字都取出来,利用java的正则操作是那么的简单. 
Java代码示例: 
Pattern p=Pattern.compile(“\\d+”); 
Matcher m=p.matcher(“我的是: 我的电话是:0 我的邮箱是:”); 
while(m.find()) { 
     System.out.println(m.group()); 


输出: 
 

123 

如将以上while()循环替换成 
while(m.find()) { 
     System.out.println(m.group()); 
     System.out.print(“start:”+m.start()); 
     System.out.println(” end:”+m.end()); 

则输出: 
 
start:6 end:12 

start:19 end:26 
123 
start:36 end:39 

现在大家应该知道,每次执行匹配操作后start(),end(),group()三个方法的值都会改变,改变成匹配到的子字符串的信息,以及它们的重载方法,也会改变成相应的信息. 
注意:只有当匹配操作成功,才可以使用start(),end(),group()三个方法,否则会抛出java.lang.IllegalStateException,也就是当matches(),lookingAt(),find()其中任意一个方法返回true时,才可以使用.


































































































































版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/211884.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月18日 下午9:22
下一篇 2026年3月18日 下午9:22


相关推荐

  • tar 打包压缩解压命令

    tar 打包压缩解压命令tar 打包压缩解压命令

    2026年3月17日
    2
  • Openclaw配置飞书流程[项目代码]

    Openclaw配置飞书流程[项目代码]

    2026年3月17日
    1
  • python中的main函数_matlab脚本中定义函数

    python中的main函数_matlab脚本中定义函数许多编程语言都有一个特殊的函数,当操作系统开始运行程序时会自动执行该函数。这个函数通常被命名为main(),并且依据语言标准具有特定的返回类型和参数。另一方面,Python解释器从文件顶部开始执行脚本,并且没有自动执行的特殊函数。尽管如此,为程序的执行定义一个起始点有助于理解程序是如何运行的。Python程序员提出了几种方式对此进行实现。本文结束时,您将了解以下内容:什么是特殊的__n…

    2022年4月20日
    71
  • 计算机二级C语言怎么过

    计算机二级C语言怎么过资料 模拟上机软件密码 q9d2 抽一一段时间 像高考模拟考试一样 看看自己能得多少分 只能用电脑运行 nbsp nbsp nbsp nbsp nbsp 计算机二级公共知识 二级语言都考察的内容 大概有 10 分左右 很多题都是背下来就能秒选的 密码 9ch6 nbsp nbsp nbsp nbsp nbsp C 语言基础知识 基础 不多说了 有不懂的地方多看看 密码 61pi nbsp nbsp nbsp nbsp nbsp dev nbsp 非常小的一个编译器 对配置要求很小 使用方法

    2026年3月26日
    2
  • f1值准确率召回率_nt值准确率高吗

    f1值准确率召回率_nt值准确率高吗##1、混淆矩阵混淆矩阵中T、F、P、N的含义:T:真,F:假,P:阳性,N:阴性然后组合:TP:真阳性TN:真阴性FP:假阳性FN:假阴性##2、精确率(准确率):你认为对的中,有

    2022年8月2日
    6
  • SpringCloud-Alibaba-Sentinel-服务降级-热点限流-服务熔断

    SpringCloud-Alibaba-Sentinel-服务降级-热点限流-服务熔断前言:除了流量控制以外,对调用链路中不稳定的资源进行熔断降级也是保障高可用的重要措施之一。一个服务常常会调用别的模块,可能是另外的一个远程服务、数据库,或者第三方API等。例如,支付的时候,可能需要远程调用银联提供的API;查询某个商品的价格,可能需要进行数据库查询。然而,这个被依赖服务的稳定性是不能保证的。如果依赖的服务出现了不稳定的情况,请求的响应时间变长,那么调用服务的方法的响应时间也会变长,线程会产生堆积,最终可能耗尽业务自身的线程池,服务本身也变得不可用熔断策略Sentinel提供

    2022年6月12日
    28

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号