11 2019 档案

hive知识点总结

摘要：hive知识点总结 1.什么是HIVE? 1.hive是hadoop生态圈的一个工具，提供一种结构化查询语言，可以查询HDFS或者其他文件系统上的文件。 2.hive操作： 1.hive一次使用命令：hive -S -e "select * from mytable limit 3"; //临时应急阅读全文

posted @ 2019-11-19 11:17 杨阳洋^_^! 阅读(393) 评论(0) 推荐(0) 编辑

zookeeper总结

摘要：zookeeper总结 1.功能总结： 1.可以为客户端管理少量数据kv，比如：/aa "hello" /aa/bb "tom" 2.可以为客户端监听数据节点的状态，并在数据节点发生变化时通知客户端 2.zk引用举例： 1.服务器上下线的动态感知：/servers/server0001 "ip,p 阅读全文

posted @ 2019-11-18 17:26 杨阳洋^_^! 阅读(109) 评论(0) 推荐(0) 编辑

大数据面试题总结

摘要：大数据面试题整理关于Java的面试题：关于虚拟机的面试题： 1.hashmap底层? 2.Java进程中断怎么处理? 3.介绍下面向对象? 4.介绍下多态? 5.方法重载和重写? 6.这俩哪个属于多态? 7.说下多线程? 8.实现方式有哪些，区别? 9.同步锁互斥，为什么常量不能做锁? 10.说阅读全文

posted @ 2019-11-18 11:14 杨阳洋^_^! 阅读(580) 评论(0) 推荐(1) 编辑

HDFS学习记录

摘要：HDFS 1.hdfs整体工作机制： 1>hdfs:分布式文件系统。 hdfs：分布式文件系统 hdfs有着文件系统共同的特征： 2>有目录结构，顶层目录是： / 3>系统中存放的就是文件 4>系统可以提供对文件的：创建、删除、修改、查看、移动等功能 2.hdfs跟普通的单机文件系统有区别： 1>单阅读全文

posted @ 2019-11-17 22:42 杨阳洋^_^! 阅读(142) 评论(0) 推荐(0) 编辑

spark项目技术点整理

摘要：spark项目技术点整理 1.性能调优： 1>分配更多的资源：性能调优的王道就是分配和增加更多的资源。写完一个spark作业后第一个要是调节最优的资源配置，能够分配的资源达到你的能力范围的顶端后，才是考虑以后的性能调优。 2>分配那些资源：executor,cpu per executor,memo 阅读全文

posted @ 2019-11-17 15:11 杨阳洋^_^! 阅读(411) 评论(0) 推荐(0) 编辑

公告

昵称：杨阳洋^_^!
园龄： 5年11个月
粉丝： 0
关注： 4

+加关注

2025年3月

日

一

二

三

四

五

六

杨阳洋^_^!

11 2019 档案

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

推荐排行榜