技术分享图片
人生三从境界:昨夜西风凋碧树,独上高楼,望尽天涯路。 衣带渐宽终不悔,为伊消得人憔悴。 众里寻他千百度,蓦然回首,那人却在灯火阑珊处。

Python_爬虫_数据解析回顾

--数据解析原理

  --定位标签

  --提取标签中存储的数据

--xpath解析原理

  --实例化一个etree的对象且将解析的页面源码数据加载到该对象中

  --通过xpath方法(返回值:列表)结合者xpath表达式进行数据解析

      -- //tagName

      -- //tagName[@attr = 'value']

      -- //tagName[index]

      -- /text() //text()

      -- /@attrName

--bs4解析原理

  --实例化一个bs4的对象且将解析的页面源码数据加载到该对象中

  --通过相关的方法和属性进行数据解析

      -- soup.tagName

      -- soup.find('tagName', attrName = 'value')  <==> find_all()

      -- select('css选择器') //标签, 类, id, 层级

      -- string,text,get_text()

      -- tag['attrName']

 

 

  

posted @ 2019-09-11 07:26  山海郡  阅读(164)  评论(0编辑  收藏  举报