摘要: 字符串是一个有序的字符集合,用于存储和表现基于文本的信息。常见的字符串常量和表达式T1=‘’ 空字符串T2="diege's" 双引号T3="""...""" 三重引号块T4=r'\temp\diege' Raw字符串 抑制(取消)转义,完全打印\tmp\diege,而没有制表符T5=u’diege... 阅读全文
posted @ 2015-05-08 23:26 *老菜鸟* 阅读(2555) 评论(0) 推荐(0) 编辑
摘要: 一、 Scrapy简介Scrapy is a fast high-level screen scraping and web crawling framework, used to crawl websites and extract structured data from their pages... 阅读全文
posted @ 2015-05-08 23:04 *老菜鸟* 阅读(406) 评论(0) 推荐(0) 编辑
摘要: 在这篇入门教程中,我们假定你已经安装了Scrapy。如果你还没有安装,那么请参考安装指南。我们将使用开放目录项目(dmoz)作为抓取的例子。这篇入门教程将引导你完成如下任务:创建一个新的Scrapy项目定义提取的Item写一个Spider用来爬行站点,并提取Items写一个Item Pipeline... 阅读全文
posted @ 2015-05-08 22:39 *老菜鸟* 阅读(25790) 评论(2) 推荐(1) 编辑