摘要: 问题描述部门的Hadoop集群运行有一个多月了,今天需要做点调整,但是突然发现Hadoop不能正常关闭!Hadoop版本:2.6.0具体情况如下:[root@master ~]# stop-dfs.sh Stopping namenodes on [master]master: no... 阅读全文
posted @ 2015-04-10 00:00 忙碌的键盘 阅读(585) 评论(0) 推荐(0) 编辑
摘要: RPC基本概念 RPC(Remote Procedure Call)是远程过程调用的简称,是一种常用的分布式网络通信协议。RPC要解决的问题就是,在分布式服务框架中实现不同服务节点(不同JVM上)之间的通信。 作为一个牛B的分布式系统,Hadoop实现了自己的RPC通信协... 阅读全文
posted @ 2015-04-09 00:00 忙碌的键盘 阅读(110) 评论(0) 推荐(0) 编辑
摘要: 因为要给百技上实训课,让新同学们自行实现一个简易RPC框架,在准备PPT时,就想写个示例,发现原来一个RPC框架只要一个类,10来分钟就可以写完了,虽然简陋,也晒晒: RPC核心类: /* * Copyright 2011 Alibaba.com All right reserve... 阅读全文
posted @ 2015-04-08 00:00 忙碌的键盘 阅读(123) 评论(0) 推荐(0) 编辑
摘要: 查看文件详细信息 参数说明 权限说明 文件类型说明 d 目录 - 普通文件 l 连接文件 b 存储设备,例如硬盘,U盘 c 串行接口设备,例如键盘、鼠标 设置文件权限 命令:chmod (chang... 阅读全文
posted @ 2015-03-25 00:00 忙碌的键盘 阅读(159) 评论(0) 推荐(0) 编辑
摘要: Hadoop版本: Hadoop 2.6.0 连接HDFS String URL="hdfs://hadoop001:9000";Configuration conf = new Configuration();conf.set("fs.defaultFS", URL);File... 阅读全文
posted @ 2015-03-24 00:00 忙碌的键盘 阅读(102) 评论(0) 推荐(0) 编辑
摘要: 搭建了一个Hadoop的环境,Hadoop集群环境部署在几个Linux服务器上,现在想使用windows上的Java客户端来操作集群中的HDFS文件,但是在客户端运行时出现了如下的认证错误,被折磨了几天,问题终得以解决。以此文记录问题的解决过程。 (如果想看最终解决问题的方法拉到最后... 阅读全文
posted @ 2015-03-24 00:00 忙碌的键盘 阅读(365) 评论(0) 推荐(0) 编辑
摘要: 出现问题 公司是做互联网广告投放的,需要统计广告展现量在前五百的域名。最简单粗暴的做法就是group by,根据url分组,然后再sort一下就搞定晒!结果问题就出现了。 如下统计的2015-02-28当日22时的日志,文档数量:904405。 db['log.201... 阅读全文
posted @ 2015-03-19 00:00 忙碌的键盘 阅读(526) 评论(0) 推荐(0) 编辑
摘要: 在对超过百万条记录的集合进行聚合操作。DBObject match=(DBObject)JSON.parse("{$match:{logType:{'$in':[5,9]}}}");DBObject group=(DBObject)JSON.parse("{$group:{'_id'... 阅读全文
posted @ 2015-03-04 00:00 忙碌的键盘 阅读(974) 评论(0) 推荐(0) 编辑
摘要: 实验环境: VMware Workstation 10.0 CentOS 6.5 Hadoop 2.4.1 Jdk1.7.0 一. Linux系统环境准备 用WindSCP等软件,把JDK和Hadoop的安装包上传到Cen... 阅读全文
posted @ 2014-12-09 00:00 忙碌的键盘 阅读(89) 评论(0) 推荐(0) 编辑
摘要: 首先了解一下常用的编码: ASCII:ASCII码是7位编码,ASCII字符集包括英文字母、阿拉伯数字和标点符号等字符。专门给英语国家设计的编码。 GB2312:中文字符集,只收录了6763个常用汉字,字符集中除常用简体汉字字符外还包括希腊字母、日文等字符,未收录繁体中文汉字和一些生... 阅读全文
posted @ 2014-12-09 00:00 忙碌的键盘 阅读(200) 评论(0) 推荐(0) 编辑