python 正则表达提取方法 (提取不来的信息print不出来加个输出type 再print信息即可)

1，正则表达提取 (findall函数提取)

import re

a= "<div class='content'>你大爷</div>"
x=re.findall("<div class='content'>(.*)</div>",a)

这样也可以:

x=re.findall(" class='content'>(.*)</d",a) 其中" class='content'>(.*)</d" 是匹配左边为class='content'> 右边为</d ，取其中的字符

print x[0]

后记: 今天傻逼了这个api 可以从中间去匹配字符

如:

x=re.findall("content'>(.*)</",a)

也可以取到中间的你大爷，下次遇到很长的字符记得从中间截取的取匹配哟!!

有时候发现输出list的字符时会展示不出:

加上print typ(x)，就可以了

取中间的数字方法:

目标

{'_id': {'created': '2022-11-24 14:32:26', 'platform': '后端'}, 'Count': 1}

取数
re.findall("(.\d*)-",trend["_id"]["created"])[1]
['2022', '11']

第二种方法:python类似正则表达式的函数

Url：http://www.jb51.net/article/54281.htm

startswith()函数

此函数判断一个文本是否以某个或几个字符开始，结果以True或者False返回。

text='welcome to qttc blog'
print text.startswith('w') # True

endswith()函数

此函数判断一个文本是否以某个或几个字符结束，结果以True或者False返回。

判断文件是否为exe执行文件

我们可以利用endswith()函数判断文件名的是不是以.exe后缀结尾判断是否为可执行文件

另外一种截取字符的: https://www.cnblogs.com/kaibindirver/p/7488885.html

posted @ 2017-09-07 11:38 凯宾斯基阅读(1149) 评论(0) 编辑收藏举报

刷新页面返回顶部

凯宾斯基