SmartDo数据挖掘思路
摘要:
SmartDo数据挖掘思路 数据挖掘部分: 数据挖掘的主要网址为: 挖掘部分为网址左边的入口,大约20多个,其中页面分级如下: 其中括号内的为点击的URL入口。 本次抓取的步骤如下: 1. 将所有类目下的URL储存到数据库中 2. 分配不同的类目的URL到不同的计算机,实行分布抓取 3. 将抓取的H 阅读全文
posted @ 2016-10-06 14:46 TTyb 阅读(376) 评论(0) 推荐(0) 编辑