关注公众号数据社,获取大数据、数据分析资料

数据社

专注大数据、数据分析、MPP数据库技术分析

数据人收藏的文章

该系列精选文章来自于「数据社」公众号,作者从事过大数据开发,大数据架构,数据分析相关岗位,有着丰富的实战经验。

该系列文章主要包括大数据平台、数据仓库、数据挖掘等。

系列文章都是基于实战总结的干货,下面列出文章链接,建议收藏,方便查看。

 

【大数据平台】

 

从0到1搭建大数据平台之数据采集系统

从0到1搭建大数据平台之调度系统

从0到1搭建大数据平台之计算存储系统

从0到1搭建自助分析平台

从0到1搭建大数据平台

基于Ambari的大数据平台搭建

基于CDH(Cloudera Distribution Hadoop)的大数据平台搭建

一文入门流处理开发

浅谈数据中台

数据中台设计方法论

收藏|如何做一个好的大数据平台架构

大数据集群迁移的那一夜是怎么过的|回忆录

收藏|Flink比Spark好在哪?

 

 

【数据仓库】

 

数据分析师应该了解的数据仓库(1)

数据分析师应该了解的数据仓库(2)

数据分析师应该了解的数据仓库(3)

数据分析师应该了解的数据湖

一文了解数据湖引擎

数据湖vs数据仓库vs数据集市

一分钟讲解数据仓库元数据

谈谈ETL中的数据质量

你是分析师,还是“提数机”?

Hive改表结构的两个坑|避坑指南

 

【数据挖掘】

 

数据挖掘从入门到放弃(一):线性回归和逻辑回归

数据挖掘从入门到放弃(二):决策树

数据挖掘从入门到放弃(三):朴素贝叶斯

数据挖掘从入门到放弃(四):手撕(绘)关联规则挖掘算法

数据挖掘从入门到放弃(五)seaborn 的数据可视化

数据挖掘从入门到放弃(六):K-means 聚类

数据挖掘从入门到放弃(七):TensorFlow和keras实现线性回归LinearRegression

数据分析为什么火了

如何入门数据分析?

用户行为分析之数据采集

用户行为分之数据处理

 

【kafka实战】

 

Kafka实战宝典:如何跨机房传输数据

kafka实战宝典:手动修改消费偏移量的两种方式

Kafka实战宝典:监控利器kafka-eagle

Kafka实战宝典:一文带解决Kafka常见故障处理

Kafka实战宝典:Kafka的控制器controller详解

 

 

【杂谈】


如何参与一个Apache开源项目

聊聊数据库

关于数据库,程序员应该了解的那些事

推荐一款可视化+NoteBook工具

 

posted @   WindyQin  阅读(231)  评论(0编辑  收藏  举报
编辑推荐:
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 单线程的Redis速度为什么快?
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 展开说说关于C#中ORM框架的用法!
点击右上角即可分享
微信分享提示