下图列出了Python支持的正则表达式元字符和语法:

字符点:匹配任意一个字符

import re
st = 'python'
result = re.findall('p.t',st)
print(result)

字符^:匹配以什么开头

import re
st = 'python'
result = re.findall('^py',st)
print(result)

字符$:匹配以什么结尾

import re
st = 'python'
result = re.findall('n$',st)
print(result)

字符*:匹配任意次,包括0次

import re
st = 'I looooooove python'
result = re.findall('lo*ve',st)#字符0可以没有,也可以无限多个,都可以匹配
print(result)

字符+:匹配一次或多次

import re
st = 'I looooooove python'
result = re.findall('lo+ve',st)#字符0没有就匹配不上
print(result)

字符?:匹配0次或一次

import re
st = 'I love python'
result = re.findall('lo?ve',st)#字符0没有也能匹配
print(result)

{m}:匹配前一个字符的m次

import re
st = 'I loooove python'
result = re.findall('o{3}',st)#匹配3个o字符
print(result)

{m,n}:匹配前一个字符的m-n次

import re
st = 'I loooove python'
result = re.findall('lo{1,4}ve',st)
print(result)

[abc]或[a-c]:匹配[]中的任意一个字符

import re
st = 'I loooove python'
result = re.findall('l[0-z]*e',st)
print(result)

[a|b]:匹配字符a或字符b

import re
st = 'I lbve python'
result = re.findall('l[a|b]ve',st)
print(result)

[^1-9]:[]里出现^字符,表示非的意思,并不表示以什么开头的意思

import re
st = 'I lb2ve python6'
result = re.findall('[^0-9]',st)
print(result)
##########################################
['I', ' ', 'l', 'b', 'v', 'e', ' ', 'p', 'y', 't', 'h', 'o', 'n']

\:

  • 反斜杠后边跟元字符去除特殊功能
  • 反斜杠后边跟普通字符实现特殊功能
  • 引用序号对应的字组所匹配的字符串

数量词的贪婪模式与非贪婪模式

正则表达式通常用于在文本中查找匹配的字符串。Python里数量词默认是贪婪的(在少数语言里也可能是默认非贪婪),总是尝试匹配尽可能多的字符;非贪婪的则相反,总是尝试匹配尽可能少的字符。例如:正则表达式"ab*"如果用于查找"abbbc",将找到"abbb"。而如果使用非贪婪的数量词"ab*?",将找到"a"。

import re
result = re.findall(r'ab*','abbbc')
print(result)
##########################################
['abbb']
import re
result = re.findall(r'ab*?','abbbc')#取消贪婪模式
print(result)
##########################################
['a']

re.match() 从头匹配

import re
origin = "hello poe bcd jet who are you 20"
r = re.match("h\w+",origin)
print(r.group())    #获取匹配到的所有结果
print(r.groups())   #获取模型中匹配到的分组结果
print(r.groupdict())    #获取模型中匹配到的分组结果
##########################################
hello
()
{}
r = re.match("(h)(\w+)",origin)
print(r.group())        #获取匹配到的所有结果
print(r.groups())       #获取模型中匹配到的分组结果
print(r.groupdict())    #获取模型中匹配到的分组结果
##########################################
hello
('h', 'ello')
{}
r = re.match("(?P<n1>h)(?P<n2>\w+)",origin)
# ?P<n1> :以键为n1,值为匹配到的这个分组,保存到字典中!?P<>这个是固定的写法
print(r.group())        #获取匹配到的所有结果
print(r.groups())       #获取模型中匹配到的分组结果
print(r.groupdict())    #获取模型中匹配到的分组结果
##########################################
hello
('h', 'ello')
{'n2': 'ello', 'n1': 'h'}

re.search() 浏览全部字符串,匹配第一个符合规则的字符串

与re.match()用法基本一样

import re
origin = "hello poe bcd jet poe who are you 20"
r = re.search("p(\w+).*(?P<name>\d)$",origin)
# ?P<n1> :以键为n1,值为匹配到的这个分组,保存到字典中!?P<>这个是固定的写法
print(r.group())        #获取匹配到的所有结果
print(r.groups())       #获取模型中匹配到的分组结果
print(r.groupdict())    #获取模型中匹配到的分组结果
##########################################
poe bcd jet poe who are you 20
(')
{'}

re.findall() 将匹配的所有内容都放置在一个列表中

注:此方法空匹配也会保存到结果中,如:

result = re.findall("","a2b3c4d5")
print(result)
print(len(result))
##########################################
['', '', '', '', '', '', '', '', '']

re.findall()方法要注意有分组的情况:

#没有分组的情况
r = re.findall("p\w+",origin)
print(r)
##########################################
['poe', 'poe']
#有分组的情况,会把匹配到的分组放到结果列表中
r = re.findall("p(\w+)",origin)
print(r)
##########################################
['oe', 'oe'] 

re.finditer()

import re
origin = "hello poe bcd jet poe who are you 20"
r = re.finditer("(p)(\w+(e))",origin)
for i in r :
    print(i.group())
    print(i.groups())
    print(i.groupdict()) 

re.split()

无分组情况,匹配到的字符串不会出现在匹配结果中:

import re
origin = "hello poe bcd jet poe who are you 20"
r = re.split("a\w+",origin,1)
print(r)
##########################################
['hello poe bcd jet poe who ', ' you 20']

有分组情况,匹配到的分组字符串也会出现在匹配结果中:

import re
origin = "hello poe bcd jet poe who are you 20"
r = re.split("a(\w+)",origin,1)
print(r)
##########################################
['hello poe bcd jet poe who ', 're', ' you 20']

re.sub() 正则替换

import re
origin = "1yiuoosfd234kuiuadf789v,xznfa978"
new_str = re.sub("\d+","KKK",origin,1)#参数1表示只替换匹配到的第一个字符串,如果是2表示替换匹配到的前2个字符串
print(new_str)
##########################################
KKKyiuoosfdKKKkuiuadf789v,xznfa978

re.subn()只是比re.sub()多返回一个数据,如:

import re
origin = "1yiuoosfd234kuiuadf789v,xznfa978"
new_str,count = re.subn("\d+","KKK",origin)#参数1表示只替换匹配到的第一个字符串
print(new_str,count)
##########################################
KKKyiuoosfdKKKkuiuadfKKKv,xznfaKKK 4

这个4表示替换匹配了4次

Python高手之路【五】python基础之正则表达式的更多相关文章

  1. Python高手之路 ------读书有感

    最近忙中偷闲把前些年买的<Python高手之路>翻了出来,大致看完了一遍,其中很多内容并不理解,究其原因应该是实践中的经验不足,而这对于现如今的我仍是难以克服的事情,对此也就只能说是看会了 ...

  2. python开发之路:python数据类型(老王版)

    python开发之路:python数据类型 你辞职当了某类似微博的社交网站的底层python开发主管,官还算高. 一次老板让你编写一个登陆的程序.咔嚓,编出来了.执行一看,我的妈,报错? 这次你又让媳 ...

  3. Python高手之路【七】python基础之模块

    本节大纲 模块介绍 time &datetime模块 random os sys shutil json & picle shelve xml处理 yaml处理 configparse ...

  4. Python高手之路【一】初识python

    Python简介 1:Python的创始人 Python (英国发音:/ˈpaɪθən/ 美国发音:/ˈpaɪθɑːn/), 是一种解释型.面向对象.动态数据类型的高级程序设计语言,由荷兰人Guido ...

  5. 我的Python成长之路---第六天---Python基础(18)---2016年2月20日(晴)

    os模块 提供对操作系统进行调用的接口 >>> import os >>> os.getcwd() # 获取当前工作目录,类似linux的pwd命令 '/data/ ...

  6. python学习之路-1 python简介及安装方法

    python简介 一种面向对象.解释型计算机程序设计语言,由Guido van Rossum于1989年发明,第一个公开发行版发行于1991年. 目前最新版本为3.5.1,发布于2015年12月07日 ...

  7. JVM菜鸟进阶高手之路十(基础知识开场白)

    转载请注明原创出处,谢谢! 最近没有什么实战,准备把JVM知识梳理一遍,先以开发人员的交流来谈谈jvm这块的知识以及重要性,依稀记得2.3年前用solr的时候老是经常oom,提到oom大家应该都不陌生 ...

  8. Python高手之路【三】python基础之函数

    基本数据类型补充: set 是一个无序且不重复的元素集合 class set(object): """ set() -> new empty set object ...

  9. Python高手之路【十一】python基础之面向对象

    创建类和对象 面向对象编程是一种编程方式,此编程方式的落地需要使用 “类” 和 “对象” 来实现,所以,面向对象编程其实就是对 “类” 和 “对象” 的使用. 类就是一个模板,模板里可以包含多个函数, ...

随机推荐

  1. Android图片选择器

    1.概述 应公司项目需求,要做一个图片选择器,网上搜索了一些源码,我在别人的基础上进行了修改,另外页面也进行了重整,我的是先加载图片文件夹列表,然后再进入选择图片.            参考博客地址 ...

  2. 【知识积累】BufferedImage类实现图片的切分

    一.引言 如何实现图片分割?若有园友用到这个模块,使用Java的BufferedImage类来实现,图片切分也可以作为一个小工具积累起来,以备不时之需. 二.代码清单 package com.lees ...

  3. 使用GitHub进行团队协作

    当进行团队协作完成一个项目时,GitHub是个不错的选择.下面是记录我和朋友做项目的时候协作的方法. 首先下载Github for windows 客户端,http://windows.github. ...

  4. 【原创】如何构建MIPS交叉编译工具链

    运行环境:Ubuntu12.04PC提前安装库:flex,bison,libncureses5-dev,texinfo,这些库提前apt-get install.需要重新安装:gawk(先apt-ge ...

  5. libwebsocket manual

    Name: libwebsocket_cancel_service - Cancel servicing of pending websocket activity Synopsis: void li ...

  6. hdu2457 Trie图+dp

    hdu2457 给定n个模式串, 和一个文本串 问如果修改最少的字符串使得文本串不包含模式串, 输出最少的次数,如果不能修改成功,则输出-1 dp[i][j] 表示长度为i的字符串, 到达状态j(Tr ...

  7. STL中队列(queue)的使用方法

    STL 中队列的使用(queue) 基本操作: push(x) 将x压入队列的末端 pop() 弹出队列的第一个元素(队顶元素),注意此函数并不返回任何值 front() 返回第一个元素(队顶元素) ...

  8. 天梯赛 L2-019. 悄悄关注 map

    L2-019. 悄悄关注 时间限制 150 ms 内存限制 65536 kB 代码长度限制 8000 B 判题程序 Standard 作者 陈越 新浪微博上有个"悄悄关注",一个用 ...

  9. [前端] jquery验证手机号、身份证号、中文名称

    验证: 中文姓名.手机号.身份证和地址 HTML(表单): <form action=""> <div class="form-group"& ...

  10. RsaUtils

    参考来源:https://www.cnblogs.com/pcheng/p/9629621.html 里面的这段话,非常好 RSA加密对明文的长度有所限制,规定需加密的明文最大长度=密钥长度-11(单 ...