摘要:
rowkey设计首先应当遵循三大原则: 1、rowkey长度原则 rowkey是一个二进制码流,可以为任意字符串,最大长度为64kb,实际应用中一般为10-100bytes,它以byte[]形式保存,一般设定成定长。 一般越短越好,不要超过16个字节,注意原因如下: (1)目前操作系统都是64位系统 阅读全文
摘要:
ubuntu教程 一、 Ubuntu简介 Ubuntu(乌班图)是一个基于Debian的以桌面应用为主的Linux操作系统,据说其名称来自非洲南部祖鲁语或科萨语的“ubuntu”一词,意思是“人性”、“我的存在是因为大家的存在”,是非洲传统的一种价值观。 Ubuntu的目标在于为一般用户提供一个最新 阅读全文
摘要:
sqoop数据迁移 查看所有的数据库 sqoop list-databases -connect jdbc:mysql://hadoop1:3306 -username root -password root 查看text库中所有表 sqoop list-tables -connect jdbc:m 阅读全文
摘要:
Hive 自定义UDF操作步骤 需要自定义类,然后继承UDF 然后在方法envluate()方法里面实现具体的业务逻辑,打包上传到linux(以免出错打包成RunningJar) 一、创建临时函数 (1)add jar /udf/xxx.jar (2)Create temporary functio 阅读全文
摘要:
hive数据导入导出 一、导入数据4种方式 建表语句 create table test( name string, friends array, children map<string, int>, address struct<street:string, city:string> ) row 阅读全文
摘要:
MySQL优化 1、索引优化 索引本身就很大,索引往往以文件的形式存储在磁盘上 (1)性能下降的原因 1)查询语句写的烂 2)索引失效 3)关联查询太多的join 7种join 4)服务器调优设置(缓冲、线程等) (2)概念:索引就是帮助MySQL高效的获取数据的数据结构 (3)优势:降低数据库的I 阅读全文
摘要:
MongoDB、Redis、elasticSearch、hbase的对比 MongoDB 优点: (1) 最大的特点是表结构灵活可变,字段类型可以随时修改。 (2) 插入数据时,不必考虑表结构的限制。 (3) 不需要定义表结构这个特点给表结构的修改带来了极大的方便。 缺点 给多表查询、复杂事务等高级 阅读全文
摘要:
数据库基本操作 创建新表 CREATE TABLE usertbl(name VARCHAR(20), signupdate DATE); 插入数据 INSERT INTO usertbl(name, signupdate) VALUES('张三', '2013-12-22'); 选择记录 SELE 阅读全文
摘要:
count(*) 和 count(1)和count(列名)区别 执行效果上: count(*)包括了所有的列,相当于行数,在统计结果的时候,不会忽略列值为NULL count(1)包括了忽略所有列,用1代表代码行,在统计结果的时候,不会忽略列值为NULL count(列名)只包括列名那一列,在统计结 阅读全文
摘要:
BigDecimal的运算——加减乘除 1、初始化(尽量用字符串的形式初始化) BigDecimal num12 = new BigDecimal("0.005"); BigDecimal num22 = new BigDecimal("1000000"); BigDecimal num32 = n 阅读全文