摘要: 转:http://www.cnblogs.com/cobbliu/archive/2012/08/24/2654368.html 第一部分、十道海量数据处理面试题 1、海量日志数据,提取出某日访问百度次数最多的那个IP。 此题,在我之前的一篇文章:十一、从头到尾彻底解析Hash表算法里头有所提到,当 阅读全文
posted @ 2018-04-20 15:24 静悟生慧 阅读(350) 评论(0) 推荐(1) 编辑
摘要: pandas: powerful Python data analysis toolkit 官方文档: http://pandas.pydata.org/pandas-docs/stable/ 1. 导入包pandas 2. 获取文件夹下文件名称 3. 读前几行文件(.csv文件) 4. 读取文件和 阅读全文
posted @ 2018-04-20 11:20 静悟生慧 阅读(270) 评论(0) 推荐(0) 编辑