?今天我们来学习python的正则表达式的部分,先说下为什么要学习这一部分呢,当然是因为正则表达式处理文本类型的数据实在是太方便了。为以后进入nlp领域打打基础!
先给大家推荐一个网站: 用于正则表达式验证.
大致就长这个样子。

1.基础知识
- 普通字符:普通字符的含义就是字节匹配他们。
- 特殊字符:它们出现在正则表达式中,不是直接匹配他们,而是表达一些特殊的含义。
.表示匹配除了换行符之外的任何单个字符
例如匹配‘’.公司‘’(匹配三个字符)
#这里展示一下python怎么使用正则表达式 import re #正则表达式的库 content=''' 苹果是红色 香蕉是黄色 叶子是绿色 天空是蓝色 ''' #将表达式转化为pattern对象,就可以调用后面的find之类的方法 p=re.compile(r'.色') for i in p.findall(content): print(i)
*表示匹配前面的子表达式任意次,包括0次
当然前面可以跟普通字符 “好” 匹配 “好好好…”
+表示匹配前面的子表达式一次或者多次,不包括0次
{ }匹配前面的字符指定的次数
2.贪婪模式和非贪婪模式
3.反斜杠的用途
反斜杠 \ 在正则表达式中多种用途,比如转义
例如:我们需要寻找.之前的所有元素 需要使用 . ∗ / . .*/. .∗/.斜杠是为了告诉程序后面一个字符代表普通字符.的含义

4.中括号的用法
如果在[]中使用^字符,则表示非的概念
5.匹配启始和结束位置
$表示文件的结尾,用法和^类似,也分多行模式和单行模式
单行模式

6.括号的用法—组选择
苹果,电话 香蕉,电话 叶子,电话 天空,电话
7.正则表达式切割字符
#我们这里有一组数据 names=‘关羽;张飞,马超,老夫子,李元芳 狄仁杰’
总结
这一这章节主要是进行正则表达式的基础学习,当作一个小小的入门教程还是很不错的,日后碰见复杂的用法会继续添加。
发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/204388.html原文链接:https://javaforall.net
