摘要: add 20190828 最近开始研究爬虫,然后发现bs4的解析模块不是很好用,就想更深入的使用re来获取页面信息: 代码如上,结果是: 解释一下: re.findall(匹配模式,匹配对象) 这里预设了一个模式使用的是re.compile <li><span 代表的是以这段字符串开头 [^.]*? 阅读全文
posted @ 2019-06-12 17:37 唐大侠的小迷弟 阅读(301) 评论(0) 推荐(0) 编辑
摘要: # encoding:utf-8 import json # 通过dumps吧字典转换成规范格式(双引号)的json a = {'a': 12, 'b': 'bb', 'c': {'c1': 123, 'c2': 'ccc'}} print(json.dumps(a)) # 通过loads吧双引号格式的json串转换成能在python中操作的字典(若不是json格式则无法使用loads方法)... 阅读全文
posted @ 2019-06-12 15:39 唐大侠的小迷弟 阅读(129) 评论(0) 推荐(0) 编辑