乔儿 - 博客园

摘要： a = ‘https://www.baidu.com/s?wd=%E7%AE%80%E4%B9%A6&rsv_spt=1&rsv_iqid=0xdfa3666f00083a6f&issp=1&f=8&rsv_bp=0&rsv_idx=2&ie=utf-8&tn=baiduhome_pg&rsv_en 阅读全文

posted @ 2019-03-17 16:16 乔儿阅读(582) 评论(0) 推荐(0) 编辑

2019年3月16日

scrapy中crawlspide中callback和follow函数的作用及使用方法

摘要： Rule(LinkExtractor(allow=r'i/tems'),callback='parse_item',follow=True) 当前代码的含义就是将当前页面及按照allow=r'i/tems'规则找出来的url的代码返回给callback='parse_item'或者供下一个rule使阅读全文

posted @ 2019-03-16 11:54 乔儿阅读(438) 评论(0) 推荐(0) 编辑

2019年3月14日

一个class标签里面有多个属性时的提取标签

摘要： <div class="uibox-con carpic-list03 border-b-solid"> #即这个标签同时满足三个class:“uibox”、“carpic-list03”、“border-b-solid”。提取此标签时：html.xpath("//div[contains(@cl 阅读全文

posted @ 2019-03-14 21:58 乔儿阅读(342) 评论(0) 推荐(0) 编辑

查看当前文件位置，及创建文件夹

摘要：阅读全文

posted @ 2019-03-14 15:49 乔儿阅读(104) 评论(0) 推荐(0) 编辑

for循环遍历改用map函数

摘要： # for url in urls:# url = response.urljoin(url)# print(url)urls = map(lambda url:response.urljoin(url),urls)print(urls)在这里要情调的是map函数运行完之后会生成一个map对象(<m 阅读全文

posted @ 2019-03-14 13:45 乔儿阅读(777) 评论(0) 推荐(0) 编辑

乔儿

公告