摘要: 好久没更博了,说明学习进度太慢了。一实施目的用抓取的数据包做统计分析,分析出行为的特征信息,用于进一步的网络诊断二实现思路对已经抓取和解析的大量的数据包,进行数据清洗和初步过滤,处理成半结构化的数据,导入到HDFS分布式文件系统中,做进一步的统计分析、信息检索、快速查询。具体采用Hive做统计特征的... 阅读全文
posted @ 2014-12-29 16:14 晋心 阅读(1319) 评论(0) 推荐(0) 编辑