探秘云原生数据库 PieCloudDB:eMPP 架构解析与实践优势

在数据库技术飞速发展的当下,云原生数据库成为众多企业关注的焦点。PieCloudDB 作为一款新兴的云原生数据库,凭借其独特的 eMPP 架构,在性能、弹性和易用性等方面展现出显著优势。

传统分布式 MPP 架构存在诸多痛点,如缺乏弹性,业务使用不灵活且成本高昂,集群固定导致资源利用率低,还有木桶效应、扩缩容难以及数据孤岛等问题,运维成本也居高不下。而云原生数据库借助云上分布式存储解耦存储,利用虚拟化技术和 IaaS 解耦计算,实现池化资源按需使用。但上云并不等同于云原生,云原生还涉及多租户隔离、计算与存储分离、弹性以及智能化平台等关键特性。

PieCloudDB 具有一系列重要特点。其 eMPP 架构中的 “e” 代表弹性(elastic),支持弹性计算资源(横向纵向)极速调整,具备多集群弹性维度,共享用户数据(如按需付费的对象存储)和元数据 ,基于 MPP 架构实现分布式海量数据并行处理。同时,它拥有完善的 Postgres 生态,提供友好的用户接口,支持完善的 SQL 标准,并且是云原生云中立的,具备 ACID 特性和完备的事务支持(隔离级别为 RR、RC)。

选择 Postgres 作为基础,是因为它公司中立、开源协议友好,具备国际一流工程水准。Postgres 对存储扩展、插件扩展支持友好,天然自带一定的多模支持,采用度和流行度持续上升,拥有优秀的生态。借助 Postgres,PieCloudDB 很多功能无需重新开发,团队也能在社区贡献力量并与一流产品和人才共同成长。
PieCloudDB 在架构设计上,涵盖共享元数据层、弹性计算层、虚拟数仓和共享存储层。元数据管理基于 MVCC 的事务隔离级别,以 key - value 形式存储元组,利用 FoundationDB Key 的自然排序实现索引,临时状态存储也放在 FoundationDB 中,多个集群可共享一份元数据 ,并通过缓存减轻 FoundationDB 集群负担、加速查询优化。用户数据存储引擎采用 PAX 行 列混存并配以高效压缩,以 Block 文件为存储单位,还考虑了高效精准的统计信息收集、存储和计算成本、各种计算优化等因素。

在存储方面,PieCloudDB 支持公有云、私有云、混合云,支持对象存储(数据共享、存算分离)按需付费,也支持 HDFS、NAS 等。用户数据具备高可靠实时加解密(TDE)机制,分布式对象存储通过多副本多可用区保证数据安全,未来还将支持 Time Travel 查询 “回收站” 数据。

查询效率优化上,考虑远程访问数据的性能和成本,通过数据和辅助信息缓存、一致性 Hash 减少数据移动,以及读取优化(如异步并行等)和计算优化等方式来提升效率。其计算引擎的优化器基于 eMPP 架构,能为复杂 OLAP 查询提供最优查询计划,处理多表连接最优顺序搜索、多阶段聚集、分区表裁剪等复杂操作。此外,还具备聚集下推等高阶计算功能,未来预计算、Data skipping 等功能也将陆续上线。

PieCloudDB 的分布式计算引擎是 MPP 弹性计算引擎,按需付费,支持租户隔离、高可用、高并发。在生态方面,天然支持各种外表数据源联邦查询组件,对 Postgres/Greenplum 组件或功能也有良好的兼容性,实时 ETL/ELT 性能有巨大提升,原生支持 kafka 数据导入和查询。

其智能化云原生平台(数据服务平台)设计目的明确,面向用户做到开箱即用,降低上手难度;面向运维,全面拥抱容器化技术,适配多种环境,部署运维难度小;面向管理,支持一个数仓多个计算集群同时运行,可根据不同业务负载选择集群,提供基于角色访问模型设计的权限系统 ,让管理更轻松。

PieCloudDB 致力于成为可靠、高效、简单、完备的 SQL 数据平台,尽管在存储、计算、生态和智能平台等方面仍面临挑战,但凭借其现有的技术优势,已经在金融、医疗等行业得到应用。未来,随着技术的不断完善和更多优秀人才的加入,PieCloudDB 有望在云原生数据库领域持续创新,为企业的数据处理和分析提供更强大的支持。

你可能感兴趣的:(云原生,数据库,架构)