随笔分类 -  大数据

摘要:原文:https://blog.csdn.net/jiguanglong/article/details/106427078 问题描述源端数据oracle数据库,通过cdm迁移工具将数据迁移到目标端hive。在oracle中的NULL值迁移到hive中后有的字段表现为NULL,有的字段表现为空串“” 阅读全文
posted @ 2022-11-15 15:52 liujiacai 阅读(1212) 评论(0) 推荐(0) 编辑
摘要:原文:https://www.dandelioncloud.cn/article/details/1529381803362369537 Hive表连接的语法支持如下: join_table: table_reference JOIN table_factor [join_condition] | 阅读全文
posted @ 2022-11-11 16:02 liujiacai 阅读(691) 评论(0) 推荐(0) 编辑
摘要:原文:https://blog.csdn.net/u010003835/category_7599581.html?spm=1001.2014.3001.5482 测试表以及测试数据+ +| createtab_stmt |+ +| CREATE TABLE `datacube_salary_org 阅读全文
posted @ 2022-11-03 15:57 liujiacai 阅读(133) 评论(0) 推荐(0) 编辑
摘要:原文:https://blog.csdn.net/weixin_44868723/article/details/124217614 1 背景介绍Hive是一个基于Hadoop的开源数据仓库工具,用于存储(HDFS)和处理(MapReduce或Spark)海量结构化数据,大多数公司都应用到Hive。 阅读全文
posted @ 2022-11-01 19:08 liujiacai 阅读(452) 评论(0) 推荐(0) 编辑
摘要:原文:https://blog.csdn.net/qq_34132046/article/details/117600817 hive —— 数据类型详细请看hive官方手册:https://cwiki.apache.org/confluence/display/Hive/LanguageManua 阅读全文
posted @ 2022-11-01 19:05 liujiacai 阅读(2397) 评论(0) 推荐(0) 编辑
摘要:原文:https://blog.csdn.net/xixihaha_coder/article/details/121229591 hive中序列化和反序列化简介 serde简介 hive的常用serde LazySimpleSerDe CSV json serde 阅读全文
posted @ 2022-11-01 18:43 liujiacai 阅读(45) 评论(0) 推荐(0) 编辑
摘要:原文:https://blog.csdn.net/qq_45124566/article/details/121724876 Hive建表注释中文乱码问题(desc/show create table)hive建表注释中文乱码问题 问题描述: create table test( id int co 阅读全文
posted @ 2022-10-12 21:11 liujiacai 阅读(357) 评论(0) 推荐(0) 编辑
摘要:原文:https://blog.csdn.net/weixin_45425565/article/details/126787184 第1章 算数运算1.1 加法: +语法:A + B 操作类型:所有数值类型 说明: 返回A与B相加的结果。结果的数值类型等于A的类型和B的类型的最小父类型(详见数据类 阅读全文
posted @ 2022-10-12 10:07 liujiacai 阅读(539) 评论(0) 推荐(0) 编辑
摘要:原文:https://cloud.tencent.com/developer/article/1880482 什么是Table API和Flink SQL Flink本身是批流统一的处理框架,所以Table API和SQL,就是批流统一的上层处理API。目前功能尚未完善,处于活跃的开发阶段。 Tab 阅读全文
posted @ 2022-08-18 21:57 liujiacai 阅读(557) 评论(0) 推荐(0) 编辑
摘要:原文:https://blog.csdn.net/weixin_44806879/article/details/124184137 Apache Doris是一个现代化的MPP分析型数据库产品。仅需亚秒级响应时间即可获得查询结果,有效地支持实时数据分析。Apache Doris的分布式架构非常简洁 阅读全文
posted @ 2022-08-05 10:44 liujiacai 阅读(5145) 评论(0) 推荐(0) 编辑
摘要:原文:https://blog.csdn.net/tktttt/article/details/108578804 Zookeeper+Hadoop+Hbase+Hive+Kylin+Nginx集群搭建一、虚拟机安装Centos71.准备工作2.centos7安装过程3.关闭防火墙(关键)二、安装j 阅读全文
posted @ 2022-05-29 00:04 liujiacai 阅读(293) 评论(0) 推荐(0) 编辑
摘要:原文:https://blog.csdn.net/fan_yi_bo/article/details/106258758 Apache Atlas部署FAQAtlas部署问题Atlas启动报错(zookeeper启动失败导致)1.问题描述2.原因定位3.解决方法Atlas启动报错(未启动solr导致 阅读全文
posted @ 2022-05-06 12:04 liujiacai 阅读(1450) 评论(0) 推荐(0) 编辑
摘要:原文:https://cloud.tencent.com/developer/article/1604685 文件系统 HDFS Hadoop Distributed File System,简称HDFS,是一个分布式文件系统。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高 阅读全文
posted @ 2022-03-23 14:26 liujiacai 阅读(366) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示