大数据技能圈 加入大数据技能圈,解锁数据世界的无限可能

Apache Doris + Apache Hudi 快速搭建指南|Lakehouse 使用手册(一)

转载来源:【SelectDB技术团队】,侵删。湖仓一体(Data Lakehouse)融合了数据仓库的高性能、实时性以及数据湖的低成本、灵活性等优势,帮助用户更加便捷地满足各种数据处理分析的需求。

kuhuo 发布于 2024-07-10

Flink+Paimon在阿里云大数据云原生运维数仓的实践

转载来源:公众号【Apache Paimon】 ,,侵删。作者欧阳武林 (伍林)

kuhuo 发布于 2024-07-09

Apache Doris 全新分区策略 Auto Partition 应用场景与功能详解

转载来源:公众号【SelectDB】,侵删。| 在 Apache Doris 中,数据划分包含分区和分桶两个层级。

kuhuo 发布于 2024-06-30

网易游戏如何基于 Apache Doris 构建全新湖仓一体架构

转载来源:公众号【 SelectDB】,侵删。| 本文将分享网易游戏在选型数据仓库架构升级过程中的思考以及基于 Apache Doris 构建湖仓一体全新架构的解决方案,并分享 Apache Doris 在关键业务场景中的落地实践。

kuhuo 发布于 2024-06-30

Apache Paimon 在蚂蚁的生产实践

转载来源:公众号【 Apache Paimon】,侵删。| Paimon 在流场景支持中做了很多工作, 同时对传统的批处理场景也对标现有其他湖格式的能力。

kuhuo 发布于 2024-06-30

Apache Paimon 表模式最佳实践

转载来源:公众号【 Apache Paimon】,侵删。| Apache Paimon 作为数据湖对各种场景有着完整的功能支持,看完这篇文章,你可以了解到 Paimon 有哪几种表模式。对应哪些场景。

kuhuo 发布于 2024-06-30

Paimon Audit Log 在贝壳找房家装数仓中的运用

转载来源:公众号【 Apache Paimon】,侵删。| Paimon 所提供的变更日志功能,可以作为一种新的数据转换方式,巧妙地解决家装行业数据建设中的业绩流水和历史变更信息的构建问题

kuhuo 发布于 2024-06-30

Flink 数据写入 Paimon 流程及源码解析

转载来源:公众号【 Apache Paimon】,侵删。| 本文对 Flink 流 / 批 Job 写数据进 Paimon 主键表的源码进行了深入浅出的总结,后续会持续更新 Paimon 别的模块的解读。

kuhuo 发布于 2024-06-30

友盟+|如何通过阿里云 Flink+Paimon 实现流式湖仓落地方案

转载来源:公众号【 Apache Flink】,侵删。| 介绍 Apache Paimon 主要优势,然后介绍基于 Paimon 在 U-App 实时基础指标计算和友盟设备ID维表更新场景的优化方案。

kuhuo 发布于 2024-06-30

Flink DataStream API 批处理能力演进之路

转载来源:公众号【 Apache Flink】,侵删。| 本文由阿里云 Flink 团队郭伟杰老师撰写,旨在向 Flink Batch 社区用户介绍 Flink DataStream API 批处理能力的演进之路。

kuhuo 发布于 2024-06-30