会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
gooey的博客
首页
新随笔
联系
订阅
管理
2015年4月25日
新浪微博爬取笔记(4):数据清理
摘要: 数据清理的部分很多,其实爬数据的过程中步骤的间隔也要做数据清理,都是很琐碎繁杂的工作。总结经验的话,就是:1、一定要用数据库存储数据 (我因为还不太会数据库,为了“节省学习时间”,所有数据项都用txt存储,直到最后出现了多个种类之间查找,文件夹树变得比较复杂,才觉得当初即使使用MySQL也会提高效率...
阅读全文
posted @ 2015-04-25 21:15 gooey
阅读(753)
评论(1)
推荐(0)
编辑
公告