10 2017 档案
摘要:由于我Spark采用的是Hortonworks公司的HDP,安装的时候是使用Ambair做离线部署的。下面主要是介绍一下如何通过SparkSQL读取HIVE中的数据。 下面我主要介绍一下我使用的情况: 1、为了让Spark能够连接到Hive的原有数据仓库,我们需要将Hive中的hive-site.x
阅读全文
摘要:Hive是基于Hadoop的数据仓库工具,可对存储在HDFS上的文件中的数据集进行数据整理、特殊查询和分析处理,提供了类似于SQL语言的查询语言–HiveQL,可通过HQL语句实现简单的MR统计,Hive将HQL语句转换成MR任务进行执行。 一、概述 1-1 数据仓库概念 数据仓库(Data War
阅读全文
摘要:由于官网和其他教程里面都是以Linux为平台演示tensorboard使用的,而在Windows上与Linux上会有一些差别,因此我将学习的过程记录下来与大家分享(基于tensorflow1.2.1版本)。 最简单的tensorboard应用 tensorboard是为了将复杂的计算图可视化的工具,
阅读全文
摘要:1、关于Tensorflow 国际惯例,先来个总体的简要介绍,摘自一个很强大的TensorFlow中文学习网站(http://www.tensorfly.cn/)的简介 TensorFlow™ 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中
阅读全文