ilvutm博园 - 博客园

2017年10月26日

摘要： Hadoop自带了一个历史服务器，可以通过历史服务器查看已经运行完的Mapreduce作业记录，比如用了多少个Map、用了多少个Reduce、作业提交时间、作业启动时间、作业完成时间等信息。默认情况下，Hadoop历史服务器是没有启动的，我们可以通过下面的命令来启动Hadoop历史服务器这样我们就阅读全文

posted @ 2017-10-26 18:52 ilvutm博园阅读(9164) 评论(0) 推荐(0)

2017年10月21日

Hive 多分隔符的使用 (转载)

摘要：方法一)通过org.apache.hadoop.hive.contrib.serde2.RegexSerDe格式的serde。 1) 建表语句 #指定以^|~作为分隔符 CREATE TABlE tableex3(id STRING, name STRING) ROW FORMAT SERDE'or 阅读全文

posted @ 2017-10-21 11:53 ilvutm博园阅读(730) 评论(0) 推荐(0)

2017年8月24日

电信行业收入疏漏点稽核的原则与方法【转】

摘要：一、收入流失是国内外电信运营商面临的普遍问题之一伴随着电信运营商所服务的客户基数的持续增长、业务体系的日趋庞杂、业务价值链的不断延伸、营销活动的不断积累和支撑系统压力不断增加，电信运营商在数据流、资金流和工作流上存在疏漏的点可能越来越多，导致收入流失的风险点也像病毒一样逐渐在侵蚀着电信运营商的肌阅读全文

posted @ 2017-08-24 11:51 ilvutm博园阅读(948) 评论(0) 推荐(0)

2017年8月8日

linux下用iptables做本机端口转发方法（转载）

摘要：一：从一台机到另一台机端口转发启用网卡转发功能 #echo 1 > /proc/sys/net/ipv4/ip_forward 举例:从192.168.0.132:21521(新端口)访问192.168.0.211:1521端口 a.同一端口转发(192.168.0.132上开通1521端口访问阅读全文

posted @ 2017-08-08 10:20 ilvutm博园阅读(27599) 评论(0) 推荐(0)

2017年7月20日

Linux 学习笔记

摘要： . 当前目录 / 根目录 ~ $HOME目录反斜杠 \告诉s h e l l该命令尚未结束 touch:创建新文件 chmod u+l filename:l权限，给文件filename加锁,别的用户不能访问此文件绝对模式：4:读 2：写 1：执行。例如：744 <==> -rwxr--r-- 一阅读全文

posted @ 2017-07-20 20:28 ilvutm博园阅读(379) 评论(0) 推荐(0)

2017年7月12日

MySQL时间差返回月个数

摘要： Sql代码 select PERIOD_DIFF(date_format(now(),'%Y%m'),date_format('2010-11-30','%Y%m')) Sql代码 Sql代码 1. MySQL 为日期增加一个时间间隔：date_add() Sql代码 set @dt = now() 阅读全文

posted @ 2017-07-12 10:45 ilvutm博园阅读(4280) 评论(0) 推荐(0)

2017年7月11日

Hive总结（七）Hive四种数据导入方式

摘要：阅读全文

posted @ 2017-07-11 20:42 ilvutm博园阅读(345) 评论(0) 推荐(0)

hive下UDF函数的使用

摘要： 1、编写函数 [java] view plaincopyprint?package com.example.hive.udf; import org.apache.hadoop.hive.ql.exec.UDF; import org.apache.hadoop.io.Text; public fi 阅读全文

posted @ 2017-07-11 20:40 ilvutm博园阅读(2777) 评论(0) 推荐(0)

hive分区（partition）

摘要：网上有篇关于hive的partition的使用讲解的比较好，转载了：一、背景1、在Hive Select查询中一般会扫描整个表内容，会消耗很多时间做没必要的工作。有时候只需要扫描表中关心的一部分数据，因此建表时引入了partition概念。2、分区表指的是在创建表时指定的partition的分区空间阅读全文

posted @ 2017-07-11 20:35 ilvutm博园阅读(19388) 评论(0) 推荐(1)

hive导出查询文件到本地文件的2种办法

摘要：通过HQL语句可以将hive 中表的数据生成到指定的目录。有时候我们可以利用hive来生成统计的中间文件（比源文件小的多的）方法有如下2种： 1.INSERT OVERWRITE LOCAL DIRECTORY 将结果输出到指定的目录：生成的文件数和redurcer的数目的一样的在hi 阅读全文

posted @ 2017-07-11 20:34 ilvutm博园阅读(4716) 评论(1) 推荐(0)

ilvutm

公告