1.数据源不同
先从数据来源上来说,数据中台的数据来源可以是结构化数据或者非结构化的数据。而传统数仓的数据来源主要是业务数据库,数据格式也是以结构化数据为主。
2.数据的处理不同
数据中台不仅仅是汇聚企业各种数据,而且让这些数据遵循相同的标准和口径,对事物的标识能统一或者相互关联,并且提供统一的数据服务接口。就像做菜一样,按照标准化的菜名,先把所有可能用到的材料都准备好。
而传统的数仓主要用来做BI的报表,目的性很单一,只抽取和清洗该相关分析报表用到基础数据,新增一张报表,就要从底层到上层再做一次。
3.从数据能力的角度来看
1,资产化的角度看,数据中台和数据仓库都能算是数据资产化,区别是数据中台能够进行全域数据的整体规划和数据全生命周期管理,数据仓库就很难实现;
2,从数据能力服务化的角度来看,数据中台通过One Data、One ID、One Service的理念,以及存储治理,计算治理的方式,可以让更多的前台应用共享数据中台提供的数据能力(比如数据API,数据标签,数据监控等等)。
数据仓库通常是为了分析某些业务指标,或分析某个主题数据而搭建,目标更明确,输出更多的是数据结果,而不是数据能力;
3,从投资回报率来看,数据中台输出的是数据能力,在建设数据中台的时候,是预估使用方对数据能力的需求,所以需要考虑ROI;数据仓库通常是有明确需求才会建设,一般不会考虑ROI;(ROI是投资回报率)
阿里巴巴的数据处理经历了四个阶段:
一是数据库阶段,主要是OLTP(联机事务处理)的需求;二是数据仓库阶段,OLAP(联机分析处理)成为主要需求;三是数据平台阶段,主要解决BI和报表需求的技术问题;四是数据中台阶段,通过系统来对接OLTP(事务处理)和OLAP(报表分析)的需求,强调数据业务化的能力。
至于报表和BI系统,其实也是数据仓库和中台性能的最好证明:
原文出处