关注公众号数据社,获取大数据、数据分析资料

数据社

专注大数据、数据分析、MPP数据库技术分析

数据人收藏的文章

该系列精选文章来自于「数据社」公众号,作者从事过大数据开发,大数据架构,数据分析相关岗位,有着丰富的实战经验。

该系列文章主要包括大数据平台、数据仓库、数据挖掘等。

系列文章都是基于实战总结的干货,下面列出文章链接,建议收藏,方便查看。

 

【大数据平台】

 

从0到1搭建大数据平台之数据采集系统

从0到1搭建大数据平台之调度系统

从0到1搭建大数据平台之计算存储系统

从0到1搭建自助分析平台

从0到1搭建大数据平台

基于Ambari的大数据平台搭建

基于CDH(Cloudera Distribution Hadoop)的大数据平台搭建

一文入门流处理开发

浅谈数据中台

数据中台设计方法论

收藏|如何做一个好的大数据平台架构

大数据集群迁移的那一夜是怎么过的|回忆录

收藏|Flink比Spark好在哪?

 

 

【数据仓库】

 

数据分析师应该了解的数据仓库(1)

数据分析师应该了解的数据仓库(2)

数据分析师应该了解的数据仓库(3)

数据分析师应该了解的数据湖

一文了解数据湖引擎

数据湖vs数据仓库vs数据集市

一分钟讲解数据仓库元数据

谈谈ETL中的数据质量

你是分析师,还是“提数机”?

Hive改表结构的两个坑|避坑指南

 

【数据挖掘】

 

数据挖掘从入门到放弃(一):线性回归和逻辑回归

数据挖掘从入门到放弃(二):决策树

数据挖掘从入门到放弃(三):朴素贝叶斯

数据挖掘从入门到放弃(四):手撕(绘)关联规则挖掘算法

数据挖掘从入门到放弃(五)seaborn 的数据可视化

数据挖掘从入门到放弃(六):K-means 聚类

数据挖掘从入门到放弃(七):TensorFlow和keras实现线性回归LinearRegression

数据分析为什么火了

如何入门数据分析?

用户行为分析之数据采集

用户行为分之数据处理

 

【kafka实战】

 

Kafka实战宝典:如何跨机房传输数据

kafka实战宝典:手动修改消费偏移量的两种方式

Kafka实战宝典:监控利器kafka-eagle

Kafka实战宝典:一文带解决Kafka常见故障处理

Kafka实战宝典:Kafka的控制器controller详解

 

 

【杂谈】


如何参与一个Apache开源项目

聊聊数据库

关于数据库,程序员应该了解的那些事

推荐一款可视化+NoteBook工具

 

posted @ 2020-10-14 22:16  WindyQin  阅读(230)  评论(0编辑  收藏  举报