07 2021 档案
摘要:Excel表格数据,如下图: import numpy as np import pandas as pd file_name = r'E:\tmp\tmp.xlsx' data = pd.read_excel(file_name) data 打印前3行数据 data.head(3) 打印1-3行数
阅读全文
摘要:--逗号分隔 beeline -u jdbc:hive2://192.192.192.1:10000 -n us1 -p 123 --verbose=true --outputformat=csv2 -e "select * from t1">>a.csv --自定义分隔 beeline -u jd
阅读全文
摘要:摘要:什么是数据湖?它有什么作用?今天将由华为云技术专家从理论出发,将问题抽丝剥茧,从技术维度娓娓道来。 什么是数据湖 如果需要给数据湖下一个定义,可以定义为这样:数据湖是一个存储企业的各种各样原始数据的大型仓库,其中的数据可供存取、处理、分析及传输。 数据湖从企业的多个数据源获取原始数据,并且针对
阅读全文
摘要:作者:我吃印度飞饼链接:https://zhuanlan.zhihu.com/p/91165577来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 Data lake这个术语由Pentaho公司的创始人兼首席技术官詹姆斯·狄克逊(James Dixon)提出,他对数据湖
阅读全文
摘要:什么是数据湖 从前,数据少的时候,人们拿脑子记就可以了,大不了采用结绳记事: 后来,为了更有效率的记事和工作,数据库出现了。数据库核心是满足快速的增删改查,应对联机事务。 比如你用银卡消费了,后台数据库就要快速记下这笔交易,更新你的卡余额。 日子久了,人们发现,库里的数据越来越多了,不光要支持联机业
阅读全文
摘要:经常看到有人问这个问题,数据玩家也看过很多解释,感觉都不够直观,这里,我尝试用一个大家都理解的例子来说明。 什么是数据仓库? 大家都去宜家买过东西吧,还记得一楼的大仓库不,你如果看中了某个家具,想要自己去仓库提货,一般都会记下商品上的编码: 这个编码对于顾客来说,肯定是没有任何含义的,看到这个编码,
阅读全文