05 2020 档案
发表于 2020-05-28 09:10阅读次数:10836评论次数:1
摘要:公众号后台越来越多人问关于数据湖相关的内容,看来大家对新技术还是很感兴趣的。关于数据湖的资料网络上还是比较少的,特别是实践系列,对于新技术来说,基础的入门文档还是很有必要的,所以这一篇希望能够帮助到想使用Hudi的同学入门。 本篇的Hudi使用的是孵化版本 0.5.2;其他依赖 Spark-2.4.
阅读全文 »
发表于 2020-05-19 09:03阅读次数:837评论次数:0
摘要:这是大数据入门常识第二篇,主要讨论大数据工作的方向问题。第一篇没看的同学可以补一下: 3000字长文教你大数据该怎么学! 有不少刚入门的同学在后台会问类似这样的问题 看招聘网站上,大数据相关的方向好多,不知道自己适合哪个怎么办? 关注我公众号的同学应该有不少是刚入门的,所以我把内容好好地整理总结了发
阅读全文 »
发表于 2020-05-14 10:36阅读次数:1954评论次数:0
摘要:大概两年前写过同样标题的一篇文章,对于这个问题感兴趣的人不少,后台收到不少同学的提问,所以准备细致地解答一下这些问题,希望能解决掉大家90%的疑问。下次再看到相关的提问我会理直气壮地把这篇文章的链接甩你脸上。但是可能又会有同学有疑问了,那剩下10%的疑问怎么办?可以关注我的公众号【老蒙大数据】。 开
阅读全文 »