摘要: Scrapy中使用xpath时,根据xpath的语法不一定能得到想要的。 如下面的html源码: 要得到img_1000后面picture的source路径,通过xpath的语法我没有得到直接取到的方法,折中办法参考:http://www.cnblogs.com/Garvey/p/6697162.h 阅读全文
posted @ 2017-08-20 08:43 笑面浮屠 阅读(2164) 评论(0) 推荐(0) 编辑
摘要: 参考: https://stackoverflow.com/questions/13303449/urllib2-httperror-http-error-403-forbidden https://segmentfault.com/q/1010000000470724 通过测试应该是request 阅读全文
posted @ 2017-08-20 08:27 笑面浮屠 阅读(1192) 评论(0) 推荐(0) 编辑
摘要: 传送门:http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html 1. 正则表达式基础 1.1. 简单介绍 正则表达式并不是Python的一部分。正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不 阅读全文
posted @ 2017-08-20 08:05 笑面浮屠 阅读(187) 评论(0) 推荐(0) 编辑
摘要: 来自Xavier的笔记:https://segmentfault.com/u/lihanx and https://segmentfault.com/q/1010000008883941 菜鸟Xpath教程:http://www.runoob.com/xpath/xpath-tutorial.htm 阅读全文
posted @ 2017-08-20 04:06 笑面浮屠 阅读(149) 评论(0) 推荐(0) 编辑