摘要: zeepplin zeeplin是基于Notebook技术开发的大数据交互分析服务软件,可以基于Web界面组合多个大数据分析引擎的处理能力,并内置提供了基于web的可视化界面,可以连接肌肤所有的Apache大数据处理服务系统。(用于大数据的分析和可视化) zeppelin-daemon.sh sta 阅读全文
posted @ 2020-06-15 10:33 齐方 阅读(205) 评论(0) 推荐(0) 编辑
摘要: 1.业务数据库同一个订单的不同状态的数据怎么处理 拉链表 2.数据仓库了解吗?建模模型 3.几个业务系统? 4.把数据存到哪儿,分析人员怎么去查数据 5.数据源有哪些 6.用户量有多少?日活多少?数据量多少? 2到3亿,人均130条数据,日活10万+,总共3亿条数据,每条1.6k,数据量300G 阅读全文
posted @ 2020-06-15 10:28 齐方 阅读(511) 评论(0) 推荐(0) 编辑