作者:kuhuo

Data Lakehouse:你的下一个数据仓库

转载来源:公众号【StarRocks】侵删。作者:张友东 StarRocks TSC member/镜舟科技 CTO

kuhuo 发布于 2024-07-11

Spark 内核的设计原理

转载来源:【公众号: DataFunSummit】侵删。本期是 DataFun 深入浅出 Apache Spark 第一期的分享,主讲老师耿嘉安开场介绍了自己的从业经历,当前就职的数新网络与 Spark 相关的两款产品 CyberEngine 和 CyberData。

kuhuo 发布于 2024-07-11

Flink CDC:基于 Apache Flink 的流式数据集成框架

转载来源:公众号【Apache Paimon】,侵删。本文整理自阿里云 Flink SQL 团队研发工程师于喜千(yux)在 SECon 全球软件工程技术大会中数据集成专场沙龙的分享。

kuhuo 发布于 2024-07-11

五万字 | Flink知识体系保姆级总结

转载来源:【五分钟学大数据】,侵删

kuhuo 发布于 2024-07-10

Apache Doris + Apache Hudi 快速搭建指南|Lakehouse 使用手册(一)

转载来源:【SelectDB技术团队】,侵删。湖仓一体(Data Lakehouse)融合了数据仓库的高性能、实时性以及数据湖的低成本、灵活性等优势,帮助用户更加便捷地满足各种数据处理分析的需求。

kuhuo 发布于 2024-07-10

Flink+Paimon在阿里云大数据云原生运维数仓的实践

转载来源:公众号【Apache Paimon】 ,,侵删。作者欧阳武林 (伍林)

kuhuo 发布于 2024-07-09

理解 Apache Paimon 一致性模型(一)

转载来源:公众号【Apache Paimon】,侵删。Apache Paimon是一种开源表格格式,是在更成熟的 Apache Iceberg、Delta Lake 和 Apache Hudi 项目之后出现的。它诞生于 Apache Flink 项目中,当时被称为 Flink Table Store,但后来成为顶级 Apache 项目。

kuhuo 发布于 2024-07-09

开发自己的AI产品--AI榜单

AI榜单代码开源了

kuhuo 发布于 2024-07-07

第20章 数据湖开发之ADS层

数据湖开发之ADS层文档

kuhuo 发布于 2024-07-07

第19章 数据湖开发之DWS层

数据湖开发之DWS层文档

kuhuo 发布于 2024-07-07