摘要: 连接查询 join SQL中将连接查询分成四类: 内连接,外连接,自然连接和交叉连接 交叉连接: cross join 从一张表中循环取出每一条记录, 每条记录都去另外一张表进行匹配: 匹配一定保留(没有条件匹配), 而连接本身字段就会增加(保留),最终形成的结果叫做: 笛卡尔积。(不常用) 基本语 阅读全文
posted @ 2019-04-02 20:35 举个栗子^-^ 阅读(158) 评论(0) 推荐(0) 编辑
摘要: 需要解决的: 如何为每个数据块分配一个Map计算任务,也就是代码是如何发送到数据块所在的服务器上面的,发送后如何启动的,启动之后如何知道自己需要计算的数据在文件什么位置(BlockID是什么)。 处于不同服务器的map输出的<key,value>,如何把相同的key聚合在一起发送给Reduce任务处 阅读全文
posted @ 2019-04-02 20:14 举个栗子^-^ 阅读(232) 评论(0) 推荐(0) 编辑
摘要: CREATE TABLE `departments` (`dept_no` char(4) NOT NULL,`dept_name` varchar(40) NOT NULL,PRIMARY KEY (`dept_no`));CREATE TABLE `dept_emp` (`emp_no` int 阅读全文
posted @ 2019-04-02 19:40 举个栗子^-^ 阅读(952) 评论(0) 推荐(0) 编辑
摘要: 建一个hash表,将文本中的每个词都放在这个hash表里面,如果这个词第一次放入,就新建一个kry,Value对,key是这个词,Value是1;如果已经有这个词,那么给Value+1。 reduce函数的计算过程:将这个集合中的1求和,再将单词(word)和这个和(sum)组成一个<key,Val 阅读全文
posted @ 2019-04-02 10:21 举个栗子^-^ 阅读(193) 评论(0) 推荐(0) 编辑