本文翻译自 Apache Cloudberry (Incubating) 官方英文博客,译文较原文有个别微调。

原文地址:https://cloudberry.apache.org/blog/cloudberry-database-enters-the-apache-incubator

2024 年 10 月 12 日,Cloudberry Database 项目通过投票获准加入 Apache 软件基金会孵化器[1],这标志着 Cloudberry 项目及其社区的一个重要里程碑。2024 年 11 月 5 日,Cloudberry 项目的关联代码仓库迁移至 Apache 软件基金会。随着此次转变,Cloudberry 正式加入 Apache 孵化器,并在其旗下启动孵化开发。此外,Cloudberry Database 正式更名为 Apache Cloudberry (Incubating)。

什么是 Cloudberry

Cloudberry 由 Greenplum Database 原始开发者创建,是一款领先且成熟的开源大规模并行处理(Massively Parallel Processing,MPP)数据库。它基于开源版的 Pivotal Greenplum Database® 衍生而来,但采用了更新的 PostgreSQL 内核,并具备更先进的企业级功能。Cloudberry 可以作为数据仓库使用,也可用于大规模分析和 AI/ML 工作负载。

图片

Greenplum Database 已被众多不同行业的小型、中型和大型团队广泛采用,并长期位居 DB-Engines 网站[2] 最受欢迎的 Top50 数据库。然而,随着开源版本 Greenplum Database 走向归档以及其社区彻底关闭,原开源用户将无法免费获取安全或功能更新,这对他们的业务造成了潜在挑战。

我们希望 Cloudberry 成为原 Greenplum 开源版本的主要开源替代方案。我们也期望所有 Greenplum 的开源开发者和用户能够迁移到 Cloudberry 上来。

Cloudberry 的来龙去脉

在展开后续内容之前,我们希望回顾一下 Greenplum Database 从闭源到开源(2015 年 10 月),再到重新闭源(2024 年 5 月)的历史:

  • Greenplum Database 最早发起于 2003 年,基于 MPP 架构和 PostgreSQL 技术,由 Greenplum 公司创建。

  • 2010 年,Greenplum 公司被 EMC 收购。

  • 2012 年,EMC 和 VMware(EMC 的子公司)将包括 Greenplum Database 在内的若干软件资产合并为一家新公司 Pivotal Software。

  • 2015 年,Pivotal 开源了 Greenplum 的核心引擎,并将其重新命名为 Pivotal Greenplum Database®,成为行业第一个开源的 MPP 数据仓库。Pivotal Greenplum Database® 的开源核心还促成了 Apache HAWQ 和 Apache MADlib 项目,但 Greenplum 本身仍是单一厂商所有的开源项目。

  • 2019 年,VMware 收购 Pivotal Software。本次收购使得 Pivotal Greenplum Database® 重回 VMware。此后,VMware 继续支持 Greenplum Database 的开发及其开源社区,并在后续几年提供 VMware Tanzu Greenplum 作为其商业产品。

  • 2023 年 11 月,Broadcom 完成对 VMware 的收购,Greenplum 归属于 Broadcom[3]

  • 2024 年 5 月,几乎所有的 Greenplum GitHub 仓库被归档并设置为只读,其 Slack 工作区(https://greenplum.slack.com)被删除,原有的 user[4] 和 dev[5] 邮件列表停止活动,此类操作均未在提前发布相关声明的情况下进行。

可以看到,Greenplum Database 多年来频繁更换所有权,引发了社区用户、开发者和生态伙伴的担忧。由于受单一厂商控制,Greenplum 缺乏允许社区参与决策的开放治理模式。

Cloudberry 的构建者认识到 Greenplum Database 已长期缺乏创新动力和主要功能更新,与新一代开源数据仓库和分析项目相比竞争力不断下降。

Cloudberry 项目始于 2022 年,由原 Greenplum 开发者打造,并在 2023 年开放源码。当 Greenplum 突然转为闭源时,这一变化令人吃惊。从那时起,我们坚定了继续使命的决心,致力于团结原 Greenplum 的开源开发者和用户,并以社区方式打造我们的项目。

Cloudberry 不是简单换名。它拥有宏伟的愿景,并提供许多先进功能与解决方案(备注:部分功能已在路线图上并等待开源进而贡献到主分支),包括更新的 PostgreSQL 内核、增强的安全性、端到端性能优化、支持 AI/ML 工作负载及流处理、湖仓集成等。我们致力于让 Cloudberry 与 Greenplum 保持兼容,让用户可以像使用 Greenplum 一样使用 Cloudberry。

为什么选择 Apache 孵化器?

加入 Apache 孵化器是 Cloudberry 的一大进步,打开了与开源世界协作、社区增长和创新的大门。Apache 孵化器为开源项目提供了治理、指导和项目管理的框架,确保项目的成长符合“Apache 之道”(Apache Way),实现以社区驱动的开发模式,保持透明和开放协作。

随着 Cloudberry 加入孵化器,我们比以往任何时候都更加致力于培养充满活力、多样化的开发者社区,并鼓励来自全球的贡献者参与。Cloudberry 也可从经验丰富的 Apache 孵化器导师们的指导中受益。我们希望通过践行“Apache 之道”(Apache Way),推动 Cloudberry 顺利从 ASF 孵化器毕业,并成为一个成熟且成功的顶级 Apache 项目。

致谢

感谢来自 Cloudberry 社区的所有贡献者,以及我们上游项目贡献者的辛勤努力!感谢 Roman Shaposhnik 作为我们的 Champion,感谢 Willem Jiang 和 Kent Yao 担任我们的导师!

加入我们

随着 Cloudberry 开始在 Apache 孵化器中的激动人心的旅程,我们邀请开发者、数据科学家和数据库爱好者一起参与进来,共同塑造 Cloudberry 的未来。无论是贡献代码、分享使用案例,还是参与讨论,我们欢迎每个人加入 Cloudberry 不断壮大的社区。

关注我们

您可以通过以下方式找到我们:

  • 网站:https://cloudberry.apache.org

  • GitHub:https://github.com/apache/cloudberry

  • Slack:https://apache-cloudberry.slack.com

  • 开发者邮件列表:

    • 订阅开发者邮件列表:发送邮件至 dev-subscribe@cloudberry.apache.org[6]

    • 浏览过去的邮件列表讨论:https://lists.apache.org/list.html?dev@cloudberry.apache.org

引用链接

[1] 2024 年 10 月 12 日,Cloudberry Database 项目通过投票获准加入 Apache 软件基金会孵化器: https://lists.apache.org/thread/qzfb38dzb1x3cg29snq4doy95gd6pzy8
[2] DB-Engines 网站: https://db-engines.com/en/ranking
[3] Broadcom 完成对 VMware 的收购,Greenplum 归属于 Broadcom: https://investors.broadcom.com/news-releases/news-release-details/broadcom-completes-acquisition-vmware
[4] `user`: https://groups.google.com/a/greenplum.org/g/gpdb-users
[5] `dev`: https://groups.google.com/a/greenplum.org/g/gpdb-dev
[6] dev-subscribe@cloudberry.apache.org: mailto:dev-subscribe@cloudberry.apache.org

免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表一休教程网的观点和立场。