实时数仓方实际落地如何选型和构建

实时数仓方实际落地如何选型和构建

一、为何需要实时数仓架构

随着数字化进程的推进,企业产生的数据越来越多,与此同时企业对数据的需求也变得越来越复杂多样。如何解决大规模复杂数据的存储和计算,已经成为很多企业必须面对的问题?这值得我们深思。
最初企业存储数据都在数仓中存储,但是随着数据量的增大,传统数据的方案在时效性上和数据维护上变得越来越困难。实时数仓架构应运而生。然而问题并不是这么简单,在具体方案落地上实时数仓有很多方案可以选择,那么面对不同的业务和应用场景我们到底应该选择哪种技术方案呢?这是困扰好多大数据架构师的问题。

二、数仓如何分层&各层用途

数仓一般分为:ODS层、DWD层、DWS层和ADS层。这里我会分别展开说一下。这部分内容大家了解数仓中每层数据的特点即可,具体研发中同学们可以根据项目再做深入体会。
实时数仓方实际落地如何选型和构建_第1张图片
1)ODS层:ODS是数据接入层,所有进入数据的数据首先会接入ODS层。一般来说ODS层的数据是多复杂多样的。从数据粒度上看ODS层是粒度最细的数据层。

2)DWD层:为数据仓库层,数据明细层的数据应是经过ODS清洗,转后的一致的、准确的、干净的数据。DWD层数据粒度通常和ODS的粒度相同,不同的是该层的数据质量更高,字段更全面等。在数据明细层会保存BI系统中所有的历史数据,例如保存近10年来的数据。

3)DWS层:数据集市层,该层数据是面向主题来组织数据的,通常

你可能感兴趣的:(大数据架构,大数据体系,数据治理,数据仓库,大数据,数据挖掘)