python 菜鸟教程 正则_华为mate30好用不

python 菜鸟教程 正则_华为mate30好用不正则表达式简介正则表达式,是一个特殊的字符序列,又称规则表达式(英语:RegularExpression,在代码中常简写为regex、regexp或RE),本质而言是一种小型的,高度专业化的编程语言。Python自1.5版本起增加了re模块,re模块使Python语言拥有全部的正则表达式功能。正则语法表关于正则语法表,别想其他的都背过就行了。不管你是python还是其他…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

正则表达式简介

正则表达式,是一个特殊的字符序列,又称规则表达式(英语:Regular Expression,在代码中常简写为regex、regexp 或RE),本质而言是一种小型的,高度专业化的编程语言。
Python 自1.5版本起增加了re 模块,re 模块使Python语言拥有全部的正则表达式功能。

正则语法表

关于正则语法表,别想其他的都背过就行了。不管你是python还是其他的语言都是一样的,所以背不过就抄到记住为止!这个你背不过,再好的教程看了也没用。如何巧记?我们需要对其进行分类。

  • 开头结尾

这一对标签,大家都不会陌生…

python 菜鸟教程 正则_华为mate30好用不

  • 模糊匹配

python 菜鸟教程 正则_华为mate30好用不

  • 关于括号

python 菜鸟教程 正则_华为mate30好用不

  • “\” 反斜杠的应用

python 菜鸟教程 正则_华为mate30好用不

  • 其他

python 菜鸟教程 正则_华为mate30好用不

re模块用法

re.(function)(pattern[, flags])
pattern : 一个字符串形式的正则表达式
flags : 可选,表示匹配模式,比如忽略大小写,多行模式等,具体参数为:

  1. re.I 忽略大小写

  2. re.L 表示特殊字符集 \w, \W, \b, \B, \s, \S 依赖于当前环境

  3. re.M 多行模式

  4. re.S 即为 . 并且包括换行符在内的任意字符(. 不包括换行符)

  5. re.U 表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依赖于 Unicode 字符属性数据库

  6. re.X 为了增加可读性,忽略空格和 # 后面的注释

  • findall() (即:全部找到,返回的是一个列表)

findall(string[, pos[, endpos]])
参数:

  1. string : 待匹配的字符串。

  2. pos : 可选参数,指定字符串的起始位置,默认为 0。

  3. endpos : 可选参数,指定字符串的结束位置,默认为字符串的长度。

import re
s = 'helloworld hellobeijing'
ret = re.findall('hello\S+',s)
print(ret)
['helloworld', 'hellobeijing']
  • finditer()

和 findall 类似,在字符串中找到正则表达式所匹配的所有子串,并把它们作为一个迭代器返回。
re.finditer(pattern, string, flags=0)
参数:

python 菜鸟教程 正则_华为mate30好用不

  • search() 与 match()

相同点:

  1. 语法:re.search/match(pattern, string, flags=0)

  2. 函数参数说明:

python 菜鸟教程 正则_华为mate30好用不

3.可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式。

python 菜鸟教程 正则_华为mate30好用不

import re
# re.search
ret = re.search('h..','hello hello world')
print(ret) # 输出结果:<_sre.SRE_Match object; span=(0, 3), match='hel'>
ret1 = re.search('h..','hello hello world').group()
print(ret1) # 输出结果:hel 只输出第一个符合条件的结果

# re.match
ret = re.match('asd','asdhskdjfksji')
print(ret) # 输出结果:<_sre.SRE_Match object; span=(0, 3), match='asd'>返回的是一个对象。
ret1 = re.match('asd','asdhskdjfasdksjiasd').group()
print(ret1) # 输出结果:asd 调用.group()方法,只返回匹配的第一个结果。

不同点:

  1. re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None

  2. re.search匹配整个字符串,直到找到一个匹配

# re.search
s = 'helloworld hellobeijing'
ret = re.search('hellob\S+',s)
print(ret)
<re.Match object; span=(11, 23), match='hellobeijing'>

# re.match
s = 'helloworld hellobeijing'
ret = re.match('hellob\S+',s)
print(ret)
None
  • split() 分隔符 对比字符串里边的split方法。

split 方法按照能够匹配的子串将字符串分割后返回列表,它的使用形式如下:

re.split(pattern, string[, maxsplit=0, flags=0])

python 菜鸟教程 正则_华为mate30好用不

import re
s = 'helloworld hellobeijing'
ret = re.split('hello',s)
print(ret)
['', 'world ', 'beijing']
  • sub() 替换;类似字符串中的replace()方法。

re.sub用于替换字符串中的匹配项。
语法:
re.sub(pattern, repl, string, count=0, flags=0)
参数:

  1. pattern : 正则中的模式字符串。

  2. repl : 替换的字符串,也可为一个函数。

  3. string : 要被查找替换的原始字符串。

  4. count : 模式匹配后替换的最大次数,默认 0 表示替换所有的匹配。

import re
s = 'helloworld hellobeijing'
ret = re.sub('hello','goodbye',s)
print(ret)
goodbyeworld goodbyebeijing
  • compile(strPattern[,flag]): 这个方法是Pattern类的工厂方法,用于将字符串形式的正则表达式编译为Pattern对象

compile 函数用于编译正则表达式,生成一个正则表达式( Pattern )对象,供 match() 和 search() 这两个函数使用。
语法格式为:
re.compile(pattern[, flags])
参数:
pattern : 一个字符串形式的正则表达式

  1. flags : 可选,表示匹配模式,比如忽略大小写,多行模式等,具体参数为:

  2. re.I 忽略大小写

  3. re.L 表示特殊字符集 \w, \W, \b, \B, \s, \S 依赖于当前环境

  4. re.M 多行模式

  5. re.S 即为 . 并且包括换行符在内的任意字符(. 不包括换行符)

  6. re.U 表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依赖于 Unicode 字符属性数据库

  7. re.X 为了增加可读性,忽略空格和 # 后面的注释

import re
pattern = re.compile('he.{3}')
pattern.match(s)
<re.Match object; span=(0, 5), match='hello'>

The End

OK,今天的内容就到这里,如果觉得内容对你有所帮助,可以点击文章右下角的“在看”。
欢迎将这篇文章或我的微信公众号【清风Python】分享给更多喜欢python的人,谢谢。

作者:清风Python

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/189596.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 关于ms17010渗透

    关于ms17010渗透今天来说一下ms17010渗透,大家都知道在2017爆发出来了永恒之蓝病毒,导致比特币严重涨价(为啥我没屯几个,这可能就是我穷的的原因吧),永恒之蓝的漏洞版本名称也被称之为ms17_010今天就来详细和大家讲一下靶机:windows7家庭普通版(感谢猫的薛定谔大佬的靶机镜像)百度云下载传送门提取码:6mus攻击机:kali4.14(emmm没给你们传百度云,自行百度下载吧)首先分别…

    2022年4月29日
    70
  • 烽火hg6543c1光猫超级密码_电信光猫hs8145c5超级密码

    烽火hg6543c1光猫超级密码_电信光猫hs8145c5超级密码坐标杭州,宽带移机。师傅给我换了个战未来的,支持万兆的光猫…以前我是依据型号网上搜索搞到超级管理员用户就行桥接的,给我换了这个新光猫后,自己死活折腾不出来…以前大家都习惯用超级管理员进入光猫,改桥接模式利用光猫的安全漏洞花式获取超级管理员密码,什么查看网络报文、telnet啊等等手段博主要告诉大家的是,这些歪门邪道未来都是不可取的,光猫更新总归是要修复这些漏洞的。而且光猫超级管理员这玩意,电信的客服、维修师傅都不用,他们都不知道有这玩意,我们折腾有啥意义呢。大家要知道:电信是允许大家改用桥接模式的。直接打1

    2022年10月8日
    0
  • visitor设计模式ppt_常用的设计模式

    visitor设计模式ppt_常用的设计模式动机Visitor是访问者的意思。数据结构中保存着元素。一般我们需要对元素进行处理,那么处理元素的代码放在哪里呢?最显然的方法就是放在数据结构的类中,在类中添加处理的方法。但是如果有很多处理,就比较麻烦了,每当增加一种处理,我们就不得不去修改表示数据结构的类。visitor模式就是用来解决这个问题的,visitor模式将数据结构的定义和处理分离开。也就是会新增一个访问者的类,将数据元素的处理交给访问者类,这样以后要新增处理的时候,只需要新增访问者就可以了。模式定义将更新(变更)封装到一个类中(访问

    2022年8月8日
    3
  • 用js来实现那些数据结构02(数组篇02-数组方法)

    上一篇文章简单的介绍了一下js的类型,以及数组的增删方法。这一篇文章,我们一起来看看数组还有哪些用法,以及在实际工作中我们可以用这些方法来做些什么。由于其中有部分内容并不常用,所以我尽量缩小篇幅。在这

    2022年3月25日
    45
  • JAVA基础知识之BufferedWriter流

    JAVA基础知识之BufferedWriter流一、BufferedWriter流    API文档说明:  1)将文本写入字符输出流,缓冲字符,以便有效地写入单个字符,数组和字符串?   说明存在用单个字符、数组、字符串作为参数的方法写入数据    2)可以指定缓冲区大小,或者可以接受默认大小。对于大多数用途,默认值足够大?   说明该类存在一个常量值用作默认缓冲区大小同时也可以通过构造函数指定大小    3)…

    2022年6月10日
    40
  • 香农编码的gui编码_香农编码

    香农编码的gui编码_香农编码香农编码概念:香农编码是是采用信源符号的累计概率分布函数来分配字码的。香农编码是根据香农第一定理直接得出的,指出了平均码长与信息之间的关系,同时也指出了可以通过编码使平均码长达到极限值。香农第一定理是将原始信源符号转化为新的码符号,使码符号尽量服从等概分布,从而每个码符号所携带的信息量达到最大,进而可以用尽量少的码符号传输信源信息。香农编码属于不等长编码,通常将经常出现的消息变成短码,不经常出现的…

    2022年9月11日
    0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号