2017年2月3日

mapreduce从数据库中分析数据,并把分析结果写入数据库中

摘要: 创建类 创建类 阅读全文

posted @ 2017-02-03 15:56 sunyaxue 阅读(2042) 评论(0) 推荐(0) 编辑

mapreduce分析百度百家作者分布的文章数和总阅读量

摘要: 主要完成的任务是从一个文件中读取数据后,去重,然后分析出作者发布的文章数量和总的阅读量之后,把分析结果保存在另一个文件中 首先创建一个flowbean 然后创建map和reduce 阅读全文

posted @ 2017-02-03 15:05 sunyaxue 阅读(285) 评论(0) 推荐(0) 编辑

hive基本操作,分析百度百家作者分布的文章数和总阅读量

摘要: hive> show tables; 查看hive中的表 hive> show databases;查看数据库 hive> drop table textlines; 删除表 hive> create table textlines(line string);创建一个名字叫textlines的表,表 阅读全文

posted @ 2017-02-03 14:13 sunyaxue 阅读(230) 评论(0) 推荐(0) 编辑

导航