摘要:
Scrapy中使用xpath时,根据xpath的语法不一定能得到想要的。 如下面的html源码: 要得到img_1000后面picture的source路径,通过xpath的语法我没有得到直接取到的方法,折中办法参考:http://www.cnblogs.com/Garvey/p/6697162.h 阅读全文
摘要:
参考: https://stackoverflow.com/questions/13303449/urllib2-httperror-http-error-403-forbidden https://segmentfault.com/q/1010000000470724 通过测试应该是request 阅读全文
摘要:
传送门:http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html 1. 正则表达式基础 1.1. 简单介绍 正则表达式并不是Python的一部分。正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不 阅读全文
摘要:
来自Xavier的笔记:https://segmentfault.com/u/lihanx and https://segmentfault.com/q/1010000008883941 菜鸟Xpath教程:http://www.runoob.com/xpath/xpath-tutorial.htm 阅读全文