Python正则表达式(一看就懂)

Python正则表达式(一看就懂)哈喽O(∩_∩)O今天来发一下python正则表达式,其实这个也是比较简单的什么是正则表达式(⊙_⊙)目前越来越多的网站、编辑器、编程语言都已支持一种叫“正则表达式”的字符串查找“公式”,有过编程经验的同学都应该了解正则表达式(RegularExpression简写regex)是什么东西,它是一种字符串匹配的模式(pattern),更像是一种逻辑公式。简单说,正则表达式是python中必备的工具,主要是用来查找和匹配字符串的。正则表达式尤其在python爬虫上用的多。正则表达

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

目录

哈喽O(∩_∩)O?

什么是正则表达式(⊙_⊙)

简单说,正则表达式是…

正则表达式怎么用❓

sreach的用法?

匹配连续的多个数值?

 字符”+”重复前面一个匹配字符一次或者多次?

字符”*”重复前面一个匹配字符零次或者多次?

字符”?”重复前面一个匹配字符零次或者一次?

特殊字符使用反斜杠”“引导,例如”\r”、”\n”、”\t”、”\”分别表示回车、换行、制表符号与反斜线自己本身

 完整表?

 match用法?

match用法?

 match对象?

数量词?

匹配开头、结尾?

 匹配分组?

match总结?

实践出真知 凸(`0´)凸 ☀️

写在最后?


哈喽O(∩_∩)O?

今天来发一下python正则表达式,其实这个也是比较简单的

肝了好几个小时才写出来呀

什么是正则表达式(⊙_⊙)

目前越来越多的网站、编辑器、编程语言都已支持一种叫“正则表达式”的字符串查找“公式”,有过编程经验的同学都应该了解正则表达式(Regular Expression 简写regex)是什么东西,它是一种字符串匹配的模式(pattern),更像是一种逻辑公式。

简单说,正则表达式是…

python中必备的工具,主要是用来查找和匹配字符串的。

正则表达式尤其在python爬虫上用的多。

正则表达式怎么用❓

首先,我们要导入头文件(写c++写习惯了)模块

import re

因为re是内置模块,所以不需要额外安装,就很银杏

sreach的用法?

匹配连续的多个数值?

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAWVJfVA==,size_20,color_FFFFFF,t_70,g_se,x_16

import re

r=r"\d+"
m=re.search(r,"YRYR567eruwgf")#目标是567
print(m)

re模块中,r“\d+”正则表达式表示匹配连续的多个数值,search是re中的函数,从”YRYR567eruwgf”字符串中搜索连续的数值,得到”567″

结果:

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAWVJfVA==,size_20,color_FFFFFF,t_70,g_se,x_16

可以看到,搜索到了连续值“567”

 字符”+”重复前面一个匹配字符一次或者多次?

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAWVJfVA==,size_20,color_FFFFFF,t_70,g_se,x_16

import re

r=r"b\d+"
m=re.search(r,"a12b1233cd")
print(m)

 这样,结果就是b后面的连续数字

结果:

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAWVJfVA==,size_20,color_FFFFFF,t_70,g_se,x_16

字符”*”重复前面一个匹配字符零次或者多次?

“*” 与 “+”类似,但有区别,列如:
可见 r”ab+“匹配的是”ab”,但是r”ab
 “匹配的是”a”,因为表示”b”可以重复零次,但是”+“却要求”b”重复一次以上

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAWVJfVA==,size_19,color_FFFFFF,t_70,g_se,x_16

import re

r=r"ab+"
m=re.search(r,"acabc")
print(m)

r=r"ab*"
m=re.search(r,"acabc")
print(m)

 结果:

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAWVJfVA==,size_20,color_FFFFFF,t_70,g_se,x_16

字符”?”重复前面一个匹配字符零次或者一次?

匹配结果”ab”,重复b一次 

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAWVJfVA==,size_20,color_FFFFFF,t_70,g_se,x_16

import re

r=r"ab?"
m=re.search(r,"abbcabc")
print(m)

 结果:

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAWVJfVA==,size_20,color_FFFFFF,t_70,g_se,x_16

特殊字符使用反斜杠”“引导,例如”\r”、”\n”、”\t”、”\”分别表示回车、换行、制表符号与反斜线自己本身

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAWVJfVA==,size_20,color_FFFFFF,t_70,g_se,x_16

import re

r=r"a\nb"
m=re.search(r,"ca\nbcaba")
print(m)

 结果:

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAWVJfVA==,size_20,color_FFFFFF,t_70,g_se,x_16

 完整表?

其实上面说这些都是比较基础,比较简单的,还有复杂一点的,都在这张表里

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAWVJfVA==,size_20,color_FFFFFF,t_70,g_se,x_16

 match用法?

match用法?

语法:re.match(pattern, string[, flags])  

从首字母开始开始匹配,string如果包含pattern子串,则匹配成功,返回Match对象,失败则返回None,若要完全匹配,pattern要以$结尾。

#示例:
name='张三'
if re.match('张\w+',name):
    print('{},你好!'.format(name))
    # 张三,你好!

输出结果:张三,你好

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAWVJfVA==,size_10,color_FFFFFF,t_70,g_se,x_16

张三:谁叫我?

不开玩笑了,继续

总的来说,match就是

  • 返回匹配的match对象
  • 默认从给定字符串的开头开始匹配、即使正则表达式没有用^声明匹配开头

 match对象?

Match对象的几个属性: 

注意,前面是有“.”的
1..string 待匹配的文本
2..re 匹配使用的pattern对象
3..pos 正则表达式搜索文本的开始位置
4..endpos 正则表达式搜索文本的结束位置
Match对象的几个方法: 
1.group(0) 返回匹配到的子串
2.start() 返回匹配子串的开始位置
3.end() 返回匹配子串的结束位置
4.span() 返回start()、end()

数量词?

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAWVJfVA==,size_19,color_FFFFFF,t_70,g_se,x_16

匹配开头、结尾?

647a8685264d461799e9dbfee4201c06.png

 匹配分组?

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAWVJfVA==,size_20,color_FFFFFF,t_70,g_se,x_16

好了,看了上面几张表,其实我觉得最重要的在下面e2e2439efb474c83ab4e691acd2d0827.png  

match总结?

其实没啥好总结的,但你要看懂这张图,这个很重要

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAWVJfVA==,size_16,color_FFFFFF,t_70,g_se,x_16

 我框出来的是我自己感觉经常用的

其实我自己刚学的时候也听不懂,现在觉得可简单了

所以,你应该现在就觉得很简单吧?

但是,正则表达式的字符很多,容易记混,一不小心就好几十个报错,很让人崩溃

80fedf710ab141abae6613a0e6b4ecca.gif

实践出真知 凸(`0´)凸 ☀️

学了这么多,是不是想撸个程序了?

已经给你准备好了

程序效果:输入手机号,通过正则表达式判断手机号合不合法,

如果合法,就输出这个手机号的信息(所属地等)

如果不合法,就重新输入,简单吧?

这里我想重点说一下怎么获取手机号的信息

我一开始打算上网上百度一波的,没想到直接复制过来23个报错、我也是醉了

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETkBZUl9U,size_20,color_FFFFFF,t_70,g_se,x_16

哎呀,不能再发表情包了

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETkBZUl9U,size_16,color_FFFFFF,t_70,g_se,x_16

ε=(´ο`*)))唉,还是自己写吧、、、

我想起了有个模块叫phone,可以实现这个功能

但是你可能还没有安装这个模块,要按命令行模式下输入pip install phone

等个六六四十九秒就下载下来了

然后你就可以体验一下了

代码(PyCharm运行通过)

import phone
from time import *
import re

def begin():
    print("欢迎来到查询小程序")
    print("1.查询")
    print("2.用户")


def p(n):
    if re.match(r'1[3,4,5,7,8]\d{9}', n):
        if re.match(r'13[0,1,2]\d{8}', n) or \
                re.match(r"15[5,6]\d{8}", n) or \
                re.match(r"18[5,6]", n) or \
                re.match(r"145\d{8}", n) or \
                re.match(r"176\d{8}", n):
            return True
        elif re.match(r"13[4,5,6,7,8,9]\d{8}", n) or \
                re.match(r"147\d{8}|178\d{8}", n) or \
                re.match(r"15[0,1,2,7,8,9]\d{8}", n) or \
                re.match(r"18[2,3,4,7,8]\d{8}", n):
            return True
        else:
            return True
    else:
        return False

if __name__ == "__main__":
    s=0
    begin()
    while True:
        op = int(input("请输入:"))
        if op==1:
            phoneNum = str(input("请输入你的电话号码"))
            if p(phoneNum)==False:
                print("该手机号无效")
                for i in range(100):
                    print('\n')
                begin()
            else:
                info = phone.Phone().find(phoneNum)
                print("手机号码:"+str(info["phone"]))
                print("手机所属地:"+str(info["province"])+"省"+str(info["city"])+"市")
                print("邮政编号:"+str(info["zip_code"]))
                print("区域号码:"+str(info["area_code"]))
                print("手机类型:"+str(info["phone_type"]))
                s+=1
                i = input("输入任意数退出...")
                for i in range(100):
                    print('\n')
                begin()
        if op==2:
            print("使用次数:"+str(s))
            i = input("输入任意数退出...")
            for i in range(100):
                print('\n')
            begin()

写在最后?

感觉这次的博客好像比较长,你能看到这里,已经超越了60%的人了,如果有谁还不是很明白,或者有c++和python的问题,都可以私信我,我看到后会一一回复哦

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETkBZUl9U,size_20,color_FFFFFF,t_70,g_se,x_16

另外,互粉必回?

感谢您的阅读,拜拜!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/159347.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • cs模式与bs的区别_BS架构是CS架构的替代品

    cs模式与bs的区别_BS架构是CS架构的替代品C/S:又称Client/Server或客户/服务器模式。客户端需要安装专用的客户端软件。 能充分发挥客户端PC的处理能力,,很多工作可以在客户端处理后再提交给服务器。C/S的主要特点是交互性强、具有安全的存取模式、网络通信量低、响应速度快、利于处理大量数据。但是该结构的程序是针对性开发,变更不够灵活,维护和管理的难度较大。通常只局限于小型局域网,不利于扩展。B/S是Browe

    2025年10月11日
    7
  • linux(9)find命令详解「建议收藏」

    linux(9)find命令详解「建议收藏」find命令格式:findpath-option[-print][-exec-okcommand]{}\;find命令的参数:path:要查找的目录路径。~表示$HO

    2022年7月31日
    5
  • python-PyPDF2

    python-PyPDF2作用:处理PDF文档提取文本,旋转页面,叠加页面1.pdfFileObj=open(‘meetingminutes.pdf’,’rb’)#打开pdf文档2.pdfReader=PyPDF2.PdfFileReader(pdfFileObj)#获取pdf文档数据3.pdfReader.numPages#获取页数4.pageObj=pdfReader.getPage(0)#获取指定页码的内…

    2022年6月23日
    33
  • 卸载pycharm重新安装_ubuntu卸载pycharm

    卸载pycharm重新安装_ubuntu卸载pycharm1.安装包下载下载地址https://www.jetbrains.com/pycharm/download/#section=linux社区版是免费的,不需要支付额外的费用,但是功能略微筛选,适合于学生群体,而专业版需要支付一定的费用,功能比较多,适用于企业,但整体的安装过程相同。2.安装在安装包过程启动终端命令,解压缩下载后的安装包修改自己的安装包版本号即可$tar-zxvfpycharm-professional-2021.3.1.tar.gz将解压缩后的目录移动到/

    2022年8月29日
    3
  • c语言 xml解析库,轻量级C语言实现的minixml解析库入门教程

    c语言 xml解析库,轻量级C语言实现的minixml解析库入门教程svn上的minixml源码下载。svncohttp://svn.msweet.org/mxml/tags/release-2.7/按照下载回来的源代码进行编译和安装。本教程只针对新手做一个引导,大神见笑了,可以直接绕道。愿这个教程给你带来帮助。即:./configuremakemakeinstall随后就可以开始使用非常简洁的并可以跨很多平台的minixml更换平台只需要将xml库使用不同…

    2022年7月14日
    50
  • 闭关六个月整理出来的微机原理知识点(特别适用河北专接本)

    闭关六个月整理出来的微机原理知识点(特别适用河北专接本)笔者准备过程中的总结,是通过填空题,简答题等等总结出来的如有不足,还望大佬们指教A14运算器和控制器又称为中央处理器(CPU)。计算机由运算器控制器存储器输入设备输出设备五大部分组成。根据传送的信息类型,系统总线可以分为三类:数据总线地址总线控制总线8086CPU由总线接口部件BIU执行部件EU组成。半导体存储器按存取方式不同,分为读写存储器RAM只读存储器ROM。读写存储器RAM指可以随机地、个别地对任意一个存储单元进行读写的存.

    2022年6月20日
    76

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号