上善若水,不进则退

姚毛毛

左手代码,右手写诗

linuxido.com

关于DTCC数据库技术大会

本次DTCC数据库技术大会是第9届了,这次大会虽然有不少公司的产品推介,总体来说还是有不少干货的。

专场较多,有选择地主要听了大数据实践跟流式计算这块。网易跟滴滴的分享比较不错。

了解到了现在大家是用spark streaming/ Flink来进行流式计算的比较多。

我们之前都是用kafka+storm+spark来做实时仓库的。

不知道spark streaming/Flink跟storm比较有什么先进之处,这个问题记下来,似乎是开发更简洁?使用SQL式开发?

对于hbase的查询,我们之前是通过solr来做二级索引,用kylin做多维分析。

但是大家现在好像用kudu+impala来做搜索的比较多,不过kylin用的也不少。但是大多没说kylin使用中的坑,有点遗憾。

说到kylin,还见到kylin的创始团队了,但是对于我提问的多表join、多字段group by效率低下的问题似乎没有解决,只说可能是我使用的方式不对。没有再追问了。

posted @   姚毛毛  阅读(307)  评论(0编辑  收藏  举报
编辑推荐:
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
阅读排行:
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 分享 3 个 .NET 开源的文件压缩处理库,助力快速实现文件压缩解压功能!
· Ollama——大语言模型本地部署的极速利器
· DeepSeek如何颠覆传统软件测试?测试工程师会被淘汰吗?
点击右上角即可分享
微信分享提示