摘要: **scrapy**是一个python的爬虫框架,用于提取结构性数据。在这次[宝贝计划][1][1]的项目中要用到一些数据。但四处联系后各方可能因为一些隐私问题不愿提供数据信息。这样我们只能自己爬取,存入数据库,再进行调用。**1.创建一个Scrapy项目:**```pythonscrapy sta... 阅读全文
posted @ 2014-12-03 11:35 chaha 阅读(527) 评论(0) 推荐(0) 编辑
摘要: 正则表达式1.正则表达式模式被编译成一系列的字节码,然后由用C编写的匹配引擎执行字符 $ 表示“字符串的末尾”(还有一个对应的字符,尖号^,表示字符串的开始)。2.我真正想要做的是,当 'ROAD' 出现在字符串的末尾,并且是作为一个独立的单词时,而不是一些长单词的一部分,才对他进行匹配。为了在正... 阅读全文
posted @ 2014-12-03 09:18 chaha 阅读(164) 评论(0) 推荐(0) 编辑