2024 年 4月 26 日随笔档案 - 袋鼠云数栈

2024年4月26日

摘要：随着企业数据规模的增长和业务多元化发展，海量数据实时、多维地灵活查询变成业务常见诉求。同时多套数据库系统成为常态，这既带来了数据管理的复杂性，又加大了数据使用的难度，面对日益复杂的数据环境和严格的数据安全要求，需要解决多数据库系统并存、数据孤岛严重、权限管理混乱和数据查询提取困难等问题。与此同时，企阅读全文

posted @ 2024-04-26 15:30 袋鼠云数栈阅读(95) 评论(0) 推荐(0) 编辑

实战干货｜Spark 在袋鼠云数栈的深度探索与实践

摘要： Spark 是一个快速、通用、可扩展的大数据计算引擎，具有高性能、易用、容错、可以与 Hadoop 生态无缝集成、社区活跃度高等优点。在实际使用中，具有广泛的应用场景： · 数据清洗和预处理：在大数据分析场景下，数据通常需要进行清洗和预处理操作以确保数据质量和一致性，Spark 提供了丰富的 API 阅读全文

posted @ 2024-04-26 14:17 袋鼠云数栈阅读(68) 评论(0) 推荐(0) 编辑

数栈DTinsight

公告