Python数据分析——正则表达式
- 概念:正则表达式是一种字符串匹配的模式
- 作用:从某个字符串中提取符合某种条件的子串
语法:
-
.匹配除换行符(\n)以外所有的字符
- \d 匹配[0-9]的数字
- \w 匹配字母数字_和中文
- * 前面的一个匹配模式出现0次或多次
- + 前面的一个匹配模式出现1次或多次
- ? 前面的一个模式出现0或1次
re.findall(pattern,string,flags=0)(重点)
作用:扫描整个string字符串,返回所有与pattern匹配的列表
参数:
pattern:正则表达式
string:从那个字符串中查找
flags:匹配模式
返回:
返回Striing中与pattern匹配的结果列表
举例:
findall()特点:(切记)
如果正则表达式中有没有()则返回与整个正则表达式匹配的列表
如果正则表达式中有(),则返回()中匹配的内容列表,小括号两边东西都是负责确定提取数据所在的位置