Linux基础之正则表达式

Linux基础之正则表达式正则表达式:又称规则表达式。(英语:RegularExpression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。正则表达式是对字符串(包括普通字符(例如,a到z之间的字母)和特殊字符(称为“元字符”))操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符…

大家好,又见面了,我是你们的朋友全栈君。

正则表达式:又称规则表达式(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。

正则表达式是对字符串(包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为“元字符”))操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。正则表达式是一种文本模式,该模式描述在搜索文本时要匹配的一个或多个字符串。

给定一个正则表达式和另一个字符串,我们可以达到如下的目的:

1. 给定的字符串是否符合正则表达式的过滤逻辑(称作“匹配”):

2. 可以通过正则表达式,从字符串中获取我们想要的特定部分。

我们可以使用 grep 命令来测试我们的正则表达式,grep命令使用正则表达式去尝试匹配指定文件的每一行,并将至少有一处匹配表达式的所有行显示出来。

grep 命令说明:

Linux基础之正则表达式

常用的选项OPTION:

-c 显示匹配到的行数之和
-o 仅显示匹配本身 
-v 显示非匹配,取反 
-i 不区分大小写
-E 支持扩展表达式 
-q 静默模式 
-n 显示匹配到的行的行号
-A 2 显示匹配到的行的后2行
-B 2 显示匹配到的行的前2行
-C 2 显示匹配到的行的前后2行
-V 显示版本信息

使用语法:

grep [OPTION]… PATTERN [FILE]…

grep “[匹配字符]匹配出现次数” /PATH/TO/SOMEFILE

字符匹配:

. 任意单个字符
[] 指定范围内的单个字符
[^] 指定范围外的的单个字符,取反
.* 任意长度的任意字符
[:alnum:] 所有的字母和数字      
[:alpha:] 所有的字母
[:blank:] 所有呈水平排列的空白字符
[:cntrl:] 所有的控制字符
[:digit:] 所有的数字
[:graph:] 所有的可打印字符,不包括空格
[:lower:] 所有的小写字母     
[:print:] 所有的可打印字符,包括空格
[:punct:] 所有的标点字符 
[:space:] 所有呈水平或垂直排列的空白字符
[:upper:] 所有的大写字母    
[:xdigit:] 所有的十六进制数
[=字符=] 所有和指定字符相等的字符

匹配次数 :

* 其前面的字符出现任意次,0次或1次,或者多次
\? 其前面的字符出现0次或1次
\+ 其前面的字符出现1次或多次,至少出现1次
\{m\} 指定字符出现次数
\{m,n\} 至少出现m次,至多出现n次,范围取次 
\{0,n\} 出现最多n次          
\{m,\} 出现最少m次

位置锚定:

^ 行首锚定,用于模式的最左侧 
$ 行尾锚定,用于模式的最右侧 
^……$ 整行, ^$ 空白行,^[[:space:]]*$  空行或者有空白字符的行
\< 或 \b  词首锚定
\> 或 \b  词尾锚定
\<……\>  精确锚定单词

分组及引用:

\{xy\}*ab     表示多个字符出现0,1或多次。 \ 在这里作为转义符使用
\(abcd\){1,3}    表示包含abcd字符串最少出现1次,最多出现3次
\(1..2\).* \1      \1 是指引用从左侧起第一个()之间的字符
\(1..2\).* \(3..4\)\2    \2 是指引用从左侧起第二个()之间的字符
\(1..2\).* \(3..4\).*\(5..6\)\3   \3 是指引用从左侧起第三个()之间的字符

 

使用实例:

查看显示 /etc/fstab 文件以 # 注释开头的行:

Linux基础之正则表达式

这里也可以不加【】:

Linux基础之正则表达式

-v 取反,即显示不以#注释的行,-o 选项为只显示匹配到的字符串:

Linux基础之正则表达式

显示 /etc/fstab 文件非注释的行,锚定行首为 # 注释的行,取反:

Linux基础之正则表达式

显示 /etc/fstab 文件以#号开头,后面跟一个空格,后面为任意长度任意字符的行, -c 选项可以统计匹配到的行数:

Linux基础之正则表达式

在 /tmp/fstab 文件中加入多个空白行,以#号开头,后面仅跟一个空格,且不以空白符结尾的行:

Linux基础之正则表达式

显示 /tmp/sshd_config 文件中不以#注释、空白行以及有空白字符的行:

Linux基础之正则表达式

显示 /etc/passwd 文件中用户名和用户SHELL为一样的行:

Linux基础之正则表达式

显示 /tmp 目录下,以非字母开头,后面跟一个字母,后面为任意长度任意字符的文件或者目录:

Linux基础之正则表达式

显示 /tmp 目录下以非字母开头,后面仅跟一个字母,然后以非字母结尾的文件和目录:

Linux基础之正则表达式

显示 /etc 目录下以p开头不以数字结尾的所有文件和目录:

Linux基础之正则表达式

显示 ip a 或者 ifconfig 命令中的IP地址,-E 选项为支持扩展正则表达式:

Linux基础之正则表达式

-l 选项可以列出包含字符串的文件列表:

Linux基础之正则表达式

-w 精确锚定字符串,相当于\<…|> :

Linux基础之正则表达式

egrep 的使用方法跟 grep 基本一致,不需要转义符 \ 看起来更简洁:

Linux基础之正则表达式

 

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/158715.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • H2数据库相关介绍「建议收藏」

    H2数据库相关介绍「建议收藏」什么是H2数据库H2是一个开源的嵌入式数据库引擎,采用java语言编写,不受平台的限制,同时H2提供了一个十分方便的web控制台用于操作和管理数据库内容。H2还提供兼容模式,可以兼容一些主流的数据库,因此采用H2作为开发期的数据库非常方便。H2是纯java编写的,源码大小只有1M左右。优点:速度非常快,开源,JDBCAPI嵌入式和服务器模式;内存数据库基于浏览器的Console应用…

    2022年10月12日
    4
  • Win10 如何配置JDK环境变量

    Win10 如何配置JDK环境变量Win10配置JDK环境

    2022年7月23日
    9
  • 职称计算机考试模块教程怎么用,【职称计算机考试模块怎么选择?】- 环球网校…

    职称计算机考试模块教程怎么用,【职称计算机考试模块怎么选择?】- 环球网校…【摘要】环球网校分享的“职称计算机考试模块怎么选择?”,以下介绍了职称计算机考试模块选择相关资料,希望对大家有帮助,更多资料敬请关注环球网校职称计算机考试频道,网校会及时更新考试资讯……问:职称计算机考试模块怎么选择?答:全国职称计算机考试模块一共设置有13类24个模块,可供各位考生选择一般评聘高级职务人员自选4个模块,评聘中级职务人员自选3个模块,评聘初级职务人员自选2个模块。在职称计算机考试模…

    2022年6月2日
    28
  • java 开发中 dom4j的简单用法「建议收藏」

    java 开发中 dom4j的简单用法「建议收藏」Java中处理XML的方式有很多种,个人任务dom4j还是比较好用的。下面介绍以下简单的使用方法先把import补充上1.首先我们一般会先根据各种方式得到一个xml格式的字符串或者文件,例如:

    2022年7月4日
    36
  • 数据格式汇总及type, astype, dtype区别「建议收藏」

    数据格式汇总及type, astype, dtype区别「建议收藏」标签(空格分隔):pythonuint8在此输入正文8位的无符号整形数据取值范围从0到255一singed与unsigned的区别二float改变类型643264to32shape翻倍改变类型321632to16shape翻倍改变类型32float32tofloatshape还原float默认是float64改变类型float64intfloat64

    2022年6月11日
    39
  • LCD1602接线图_srd继电器接线图

    LCD1602接线图_srd继电器接线图转载于:https://my.oschina.net/surenpi/blog/481697

    2022年9月2日
    5

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号