会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
温柔易淡
博客园
首页
新随笔
联系
订阅
管理
2017年1月8日
2 python大数据挖掘系列之淘宝商城数据预处理实战
摘要: preface 在上一章节我们聊了python大数据分析的基本模块,下面就说说2个项目吧,第一个是进行淘宝商品数据的挖掘,第二个是进行文本相似度匹配。好了,废话不多说,赶紧上车。 淘宝商品数据挖掘 数据来源: 自己写个爬虫爬吧,爬到后入库(mysql)。 数据清洗: 所谓的数据清洗,就是把一些异常的
阅读全文
posted @ 2017-01-08 16:38 温柔易淡
阅读(3958)
评论(0)
推荐(0)
编辑
公告