摘要:
参考教程:菜鸟教程 https://www.runoob.com/python3/python3-tutorial.html 使用的开发工具是Jupyter Notebook(Anaconda) 下面我主要是介绍一些需要注意的点和练习过程: 说在前面:动手很重要 一、python基本语法 1.标识符 阅读全文
摘要:
了解YARN 一、什么是YARN? Apache Hadoop YARN (Yet Another Resource Negotiator,另一种资源协调者)是一种新的 Hadoop 资源管理器,它是一个通用资源管理系统,可为上层应用提供统一的资源管理和调度,它的引入为集群在利用率、资源统一管理和数 阅读全文
摘要:
Hive基础 一、Hive是什么? Hive的本质就是:将HQL/SQL转化为MapReduce程序在Hadoop上运行,可以看成是一个SQL解析引擎 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。 Hive表是HDFS的文件目录,一个表对 阅读全文