Python下使用正则表达式
正则表达式
- 使用单个字符串来描述匹配一系列符合某个句法规则的字符串。
- 是对字符串操作的一种逻辑公式
- 应用场景:处理文本和数据
- 正则表达式过程:依次拿出表达式和文本中的字符比较,如果每一个字符都能匹配, 则匹配成功;否则匹配失败。
import re:正则表达式模块:Python通过re模块提供对正则表达式的支持。使用re的一般步骤是先将正则表达式的字符串形式编译为Pattern实例,然后使用Pattern实例处理文本并获得匹配结果(一个Match实例),最后使用Match实例获得信息,进行其他的操作。r代表进行匹配的是元字符串, 不使用元字符串则需要注意转译的情况。
使用正则表达式匹配字符串开头是否为指定的字符或字符串:import re str1 = 'test python' # 将正则表达式编译成pattern对象 # 使用r'test', r代表进行匹配的是元字符串 pa = re.compile(r'test') # pa已经成为一个pattern实例 print(type(pa)) ma = pa.match(str1) # 若匹配成功, ma成为一个match对象 print(ma) print(ma.group()) # group()返回一个str或者tuple print(ma.span()) # 返回字符串的索引 print(ma.re) # pattern的实例
# 返回结果 <class '_sre.SRE_Pattern'> <_sre.SRE_Match object; span=(0, 4), match='test'> test (0, 4) re.compile('test')
正则表达式语法
Python正则表达式--re模块其他方法
- search(pattern, string, flags=0)在一个字符串中查找匹配
- findall(pattern, string, flags=0)找到匹配,返回所有匹配部分的列表
- sub(pattern, repl, string, count=0, flags=0)将字符串中匹配正则表达式的部分替换为其它值
- split(pattern, string, maxsplit=0, flags=0)根据匹配分割字符串, 返回分割字符串组成的列表
当前页面是本站的「Google AMP」版。查看和发表评论请点击:完整版 »