Scrapy基础------css选择器基础

基本语法：
 

*                  选择所有节点
#container         选择id为container的节点
.container      选择所有class包含container的节点
li a            选取所有li 下所有a节点
ul + p          选取ul后面的第一个p元素
div#container > ul 选取id为container的div的第一个ul子元素
ul ~p             选取与ul相邻的所有p元素
a[title]        选取所有有title属性的a元素
a[href="http://jobbole.com"]  选取所有href属性为http://jobbole.com的a元素
a[href*="jobbole"]     选取所有href属性值中包含jobbole的a元素

a[href^="http"]    选取所有href属性值中以http开头的a元素
a[href$=".jpg"]    选取所有href属性值中以.jpg结尾的a元素
input[type=radio]:checked   选择选中的radio的元素

div:not(#container)  选取所有id为非container 的div属性
li:nth-child(3)      选取第三个li元素
li:nth-child(2n)      选取第偶数个li元素

//通过 名为 video_part_lists 的Class 中下面的 li 标签

liList = response.css('.video_part_lists li') 

for li in liList:
再通过li 标签获取 a 标签中得  href 属性
   name= li.css('a::attr(href)').extract()

posted @ 2017-10-08 18:05 xushukui 阅读(230) 评论(0) 编辑收藏举报

刷新页面返回顶部

xushukui

Scrapy基础------css选择器基础

公告