2013 年 12月 14 日随笔档案 - darlwen

2013年12月14日

摘要：目标是爬取网站http://www.muyingzhijia.com/上全部的商品数据信息，包括商品的一级类别，二级类别，商品title，品牌，价格。搜索了一下，python的scrapy是一个不错的爬虫框架，于是基于scrapy写了一个简易的爬虫。先分析商品页面，在http://www.muyingzhijia.com/主页面上，有类链接有用的链接，即：http://www.muyingzhijia.com/Shopping/category.aspx?cateID=11和http://www.muyingzhijia.com/Shopping/subcategory.aspx?cateID 阅读全文

posted @ 2013-12-14 20:26 darlwen 阅读(562) 评论(0) 推荐(0) 编辑

Darlwen

enjoy coding, enjoy research, enjoy life.

公告