2019 年 6月 12 日随笔档案 - 唐大侠的小迷弟

2019年6月12日

摘要： add 20190828 最近开始研究爬虫，然后发现bs4的解析模块不是很好用，就想更深入的使用re来获取页面信息：代码如上，结果是：解释一下： re.findall(匹配模式，匹配对象) 这里预设了一个模式使用的是re.compile <li><span 代表的是以这段字符串开头 [^.]*? 阅读全文

posted @ 2019-06-12 17:37 唐大侠的小迷弟阅读(301) 评论(0) 推荐(0) 编辑

json模块

摘要： # encoding:utf-8 import json # 通过dumps吧字典转换成规范格式（双引号）的json a = {'a': 12, 'b': 'bb', 'c': {'c1': 123, 'c2': 'ccc'}} print(json.dumps(a)) # 通过loads吧双引号格式的json串转换成能在python中操作的字典(若不是json格式则无法使用loads方法)... 阅读全文

posted @ 2019-06-12 15:39 唐大侠的小迷弟阅读(129) 评论(0) 推荐(0) 编辑

唐大侠的小迷弟

公告