requests + BeautifulSoup + json

requests:

  response.text       以 unicode 格式显示响应的文本

  response.content    以 二进制 格式显示响应的文本

 

BeautiSoup:

  soup = BeautifulSoup (response.text,解析方式)  常用的解析方式有 "html.parser"  "lxml"

  soup.prettify()  美化文本方便查看

  soup.seleect(#id)  soup.seleect(.class)  例如 select("#buy_immediately_bottom") 定位id为buy_immediately_bottom的那(些)元素

  soup.find_all (xx)  查询所有的xx

  soup.find(xx)  查询第一个出现的xx,相当于 soup.find_all(xx,limit=1)

 

import json

json.loads("字典格式的文本"),处理后的结果就是字典

posted on 2018-01-07 13:25  chungehpu  阅读(237)  评论(0编辑  收藏  举报

导航