摘要: 1、re正则的用法总结 (1)、 ^ 表示以哪个字符为开头 eg: '^g' 表示以g开头的字符串 . 表示任意字符 '^g.d' 表示以g开头第二个为任意字符,第三个为b的字符串 *表示 某个字符出现任意多次 (2)、$表示以某个字符为结尾的字符串 运行结果为:'yes' (3)、 ?表示非贪婪模 阅读全文
posted @ 2017-11-01 10:46 jiuyang 阅读(1844) 评论(3) 推荐(0) 编辑
摘要: 1、scrapy 新建项目 2、spiders编写(以爬取163北京新闻为例) 此例中用到了scrapy的Itemloader机制,itemloader中有三个比较重要的方法,有add_xpath(),add_value(),add_css(),这三个方法中,都有两个参数第一个为item的名,第二个 阅读全文
posted @ 2017-11-01 10:43 jiuyang 阅读(462) 评论(0) 推荐(0) 编辑