摘要:看过MR的处理流程的人应该都知道,在MR处理的时候有个split,这个split数量决定了mapper的数量,那split是怎么来的呢?我们在写MR代码的时候也没有接口可以定义split的数量,那split怎么来的? 有人说是block数量,真是是这样吗? 我们来看一下源码: 其中的getMinSp
阅读全文
04 2018 档案
摘要:看过MR的处理流程的人应该都知道,在MR处理的时候有个split,这个split数量决定了mapper的数量,那split是怎么来的呢?我们在写MR代码的时候也没有接口可以定义split的数量,那split怎么来的? 有人说是block数量,真是是这样吗? 我们来看一下源码: 其中的getMinSp
阅读全文
摘要:mysql binlog恢复数据,有时候可能不小心delete了数据,一下子捉急了,怎么办? binlog来恢复(前提是你开启了binlog),怎么开启呢? 在my.cnf文件中添加如下 [mysqld]log_bin = mysql_bin 重启服务即可 接下来讲讲怎么恢复,删除数据后,马上查看当
阅读全文
摘要:最近nginx访问经常出现502, 甚至还出现进程无法创建的问题,首先是怀疑Linux连接数设置有问题, ulimit -u查看连接数为2w,应该不算低,后来就给调到的6w; 查下Linux上的当前的线程数, pstree -p| wc -l 存在七千多,怎么会呢? 于是pstree -p | mo
阅读全文
摘要:记得这是曾经面阿里的一个面试题,数据量亿级别的数据,提升查询效率怎么去处理? 这里不讲什么导ES,导Hbase之类的, 只通过mysql来处理,这时候会用到分区表; 分区表怎么个意思呢? 跟hive里面的partition类似,但是功能没有hive强大,有很多限制,mysql 5.01后开始支持,创
阅读全文
摘要:一、INFORMATION_SCHEMA介绍 第一个查询看看库里有多少个表,表名等select * from INFORMATION_SCHEMA.TABLES information_schema这张数据表保存了MySQL服务器所有数据库的信息。如数据库名,数据库的表,表栏的数据类型与访问权限等。
阅读全文
摘要:昨天写sql文件时把以前一直不是很明白的地方弄明白了,就是在设置int型的时候,需要设置int(M),以前知道这个M最大是255,但是到底应该设置多少并没有在意。 查了下官方manual 有这样的语句: M indicates the maximum display width for intege
阅读全文
摘要:MySQL字符串类型有varchar和char类型,这两者区别很多人都知道,我经常搞混。。 所以这里记一下: varchar类型是可变长度; 适合存储长度不一致的数据类型; char类型是固定长度;适合存储固定的长度类型,比如手机号,身份证号等; 当然还有text的字符串类型; 那查询速度哪个快呢?
阅读全文
|