随笔 - 368, 文章 - 0, 评论 - 56, 阅读 - 94万
  博客园  :: 首页  :: 联系 :: 管理

09 2016 档案

摘要:目录: 连接hadoop配置语法 配置hadoop连接 Pushdown配置 Create external tables for Azure blob storage 连接hadoop配置语法: global configuration settings for PolyBase Hadoop a 阅读全文

posted @ 2016-09-30 12:03 天戈朱 阅读(685) 评论(2) 推荐(0) 编辑

摘要:目录: Prerequisites 集群配置规划 polybase install firewall config 集群配置 删除计算节点 install Prerequisites Microsoft .NET Framework 4.5 Oracle Java SE RunTime Enviro 阅读全文

posted @ 2016-09-28 19:06 天戈朱 阅读(1202) 评论(0) 推荐(0) 编辑

摘要:polybase集群要求使用相同的域账号,本节介绍选择用Azure虚拟机搭建自己的内网DNS服务器和域控 创建虚拟网络polybase,创建名为DNS的子网,如下图: 创建虚拟机,选择polybase,如下图: 虚拟机创建完成后,在portal仪表盘界面查看分配的IP地址,如下图: 设置静态IP,此 阅读全文

posted @ 2016-09-19 05:35 天戈朱 阅读(1304) 评论(0) 推荐(0) 编辑

摘要:PolyBase is a technology that accesses and combines(整合) both non-relational and relational data, all from within SQL Server. It allows you to run quer 阅读全文

posted @ 2016-09-18 22:08 天戈朱 阅读(1910) 评论(0) 推荐(0) 编辑

摘要:当微软发布第一个SQL Server并行数据仓库R2时(SQL ServerParallel Data Warehouse,即PDW),已正式将产品的名称修改为分析服务平台(APS),但在一些非正式场合,仍然保留了PDW的叫法 目录: APS简介 APS特性 NEC一体机 戴尔数据库一体机 小结 A 阅读全文

posted @ 2016-09-18 19:15 天戈朱 阅读(941) 评论(0) 推荐(1) 编辑

摘要:DW一直以来是企业信息与决策支持系统的核心组件,随着各类日志、社交、传感等非结构化数据的加入,企业内部数据按指数级增长,传统DW已经达到一个关键临界点——需要大量的资源投入到硬件、优化、支持和维护中,当前大部分使用Apache Hadoop来处理各种来源的大数据,但传统数据仓库不允许最终用户查询非结 阅读全文

posted @ 2016-09-18 19:15 天戈朱 阅读(5492) 评论(0) 推荐(0) 编辑

摘要:在 HBase(六): HBase体系结构剖析(上) 介绍过,Hbase创建表时,只需指定表名和至少一个列族,基于HBase表结构的设计优化主要是基于列族级别的属性配置,如下图: 目录: BLOOMFILTER BLOCKSIZE IN_MEMORY COMPRESSION/ENCODING VER 阅读全文

posted @ 2016-09-11 22:24 天戈朱 阅读(4807) 评论(0) 推荐(0) 编辑

摘要:HBase自带的很多工具可用于管理、分析、修复和调试,这些工具一部分的入口是hbase shell 客户端,另一部分是在hbase的Jar包中。 目录: hbck hfile 数据备份与恢复 hbck: hbck 工具用于Hbase底层文件系统的检测与修复,包含Master、RegionServer 阅读全文

posted @ 2016-09-11 15:51 天戈朱 阅读(5441) 评论(0) 推荐(1) 编辑

摘要:目录: write Compaction splite read Write: 当客户端发起一个Put请求时,首先根据RowKey寻址,从hbase:meta表中查出该Put数据最终需要去的HRegionServer 客户端将Put请求发送给相应的HRegionServer,在HRegionServ 阅读全文

posted @ 2016-09-10 22:18 天戈朱 阅读(2120) 评论(0) 推荐(0) 编辑

摘要:HBase隶属于hadoop生态系统,它参考了谷歌的BigTable建模,实现的编程语言为 Java, 建立在hdfs之上,提供高可靠性、高性能、列存储、可伸缩、实时读写的数据库系统。它仅能通过主键(row key)和主键的range来检索数据,主要用来存储非结构化和半结构化的松散数据。与hadoo 阅读全文

posted @ 2016-09-10 19:37 天戈朱 阅读(6200) 评论(2) 推荐(2) 编辑

摘要:在电池的大家族中,蓄电池的种类是最多的,共同的特点是可以经历多次充电、放电循环,反复使用,这也正是蓄电池作为电动汽车动力源的基础。当然,并不是所有的蓄电池都适合应用于电动汽车,从全球新能源汽车的发展来看,市场上的新能源汽车动力电池基本为锂离子电池。 电动汽车对动力电池的要求主要如下: 电池分类和指标 阅读全文

posted @ 2016-09-06 08:31 天戈朱 阅读(2644) 评论(0) 推荐(0) 编辑

摘要:基于 HDP2.4安装(五):集群及组件安装 创建的hadoop集群,修改默认配置,将hbase 存储配置为 Azure Blob Storage 目录: 简述 配置 验证 FAQ 简述: hadoop-azure 提供hadoop 与 azure blob storage 集成支持,需要部署 ha 阅读全文

posted @ 2016-09-05 21:19 天戈朱 阅读(2296) 评论(1) 推荐(0) 编辑

摘要:基于linux 创建HDInsight HBase集群,选择最小配置,zk(3)、NN(2)、WN(2),集群节点默认组件服务规划如下 NN0: Active NameNode /HDFS ZKFailoverController/HDFS App Timeline Server /YARN Act 阅读全文

posted @ 2016-09-05 21:19 天戈朱 阅读(600) 评论(0) 推荐(0) 编辑

摘要:目录: hdfs 命令操作本地 hbase Azure HDInsight HBase表数据导入本地 hbase hdfs命令操作本地hbase: 参见 HDP2.4安装(五):集群及组件安装 , 创建本地 hbase集群后,使用hadoop hdfs 命令在访问 hbase 存储数据时,数据在hd 阅读全文

posted @ 2016-09-03 05:46 天戈朱 阅读(1189) 评论(0) 推荐(0) 编辑

摘要:hdfs dfs -cat URI : 查看文件内容 -ls <args>: 查文件列表 -mkdir <paths> : 创建目录 The behavior is much like unix mkdir -p creating parent directories along the path 阅读全文

posted @ 2016-09-03 05:43 天戈朱 阅读(2443) 评论(0) 推荐(0) 编辑

摘要:SparkSQL是指整合了Hive的spark-sql cli, 本质上就是通过Hive访问HBase表,具体就是通过hive-hbase-handler, 具体配置参见:Hive(五):hive与hbase整合 目录: SparkSql 访问 hbase配置 测试验证 SparkSql 访问 hb 阅读全文

posted @ 2016-09-01 21:25 天戈朱 阅读(9380) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示