2 数据中台之“规”,重点在标签体系
“规”,有法度也,是规则、是制度、是体系。
讲数据的,通常把书类比为石油,“规”就相当于是石油提纯的一个过程,那么数据中台的“规”就是对数据提纯的一个过程,即“数据资产化”过程。我们知道石油提纯有一系列的标准体系,那么数据资产化也同样需要建立完备的数据资产体系。金融机构数据资产体系建设必须围绕业务价值,从推动业务数据向数据资产转化的角度来构建。
传统的数字化建设往往局限在单个业务单元,忽视了数据多业务关联的属性,缺乏对数据的深度理解。数据中台必须连通全域数据,通过统一的数据标准,构建规范的、紧密结合业务的、可扩展的数据标签体系。
数据中台建设的核心是数据,数据中台管理的核心也是数据,数据中台应用的核心还是数据。数据对于金融企业如此重要,那么数据中台建设过程中,我们依靠什么样的数据体系来构建我们的数据中台?那么数据中台的数据建设体系应该是什么样的,这些都是需要我们有一个基本认知的。
我们认为数据中台建设,至少应该包含应用、标签、主题、贴源这4个层级结构。
贴源层:这个名字不知道是哪位前辈取的,顾名思义,很形象,和源数据保持一致;那么他的作用,对于我们技术部门来说还是很重要的,通俗理解就是“甩锅”,关于这一点,大家可以细品……
主题层:金融企业常用的十大数据主题,对应的就是数据体系中这个层面,这里不多赘述,这一层对应的也是数据整合、汇聚的范畴。
标签层:即数据对象建模层。我们讲数据整合方式时,把基于ID(身份)的整合放到了一边,那么在这里,我们就是基于 ID 把各主题、业务过程的同一对象跨主题、跨业务板块进行打通,形成对象的全域级标签体系,以方便对数据的深度分析、价值挖掘、敏捷应用。
应用层:按照金融企业特定的业务场景,从标签层、主题层抽取数据,面向业务进行加工特定的数据,以为业务提供端到端的数据服务。当然,有些特定的业务场景需要兼顾性能需求、紧急事物需求,也可能直接从贴源层抓取数据直接服务于特定的业务场景。真正做到在对业务端到端数据服务同时,兼顾数据中台的灵活性、可用性和稳定性。
标签层——数据中台的价值魅力体现
数据标签体系建设,一来可以让数据可读,即数据开发者和数据使用者对数据的认知统一,更方便端到端的数据使用;二来通过数据标签目录将标签组织化、结构化,以一种更柔性的方式来适应未来多元化业务场景对数据应用的诉求。
以上是一个金融机构比较常见的客户标签;?数据中台的数据是不断的在被业务滋养,在数据中台的运营过程中,结合上图我们不难想象到,标签数据不是一成不变的,它在被业务滋养的同时,也需要不断的调整(参数、指标、属性、特征等),以更好的反哺业务,不断互补,让数据中台为业务提供更有价值的数据服务。所以,我们总结整个标签建设的过程大致分为以下几步:
Step 1、数据对象认知:全面理清数据关系,确定数据对象。 Step 2、制定标签目录结构:根据业务需求,定制标签体系框架,原则上按照三层目录分层(具体情况具体对待),并且逐步填充标签内容。Step 3、整合可用数据资源:通过对象ID及ID-ID的映射关系,整合和对象相关的业务数据资源,如:账户数据、交易数据、行为数据、交易数据、风险数据、社交数据等。Step 4、构建标签模型:结合业务需求及业务人员的经验,对数据进行建模,进一步挖掘、完善标签。Step 5、标签应用:将标签应用到实际的业务场景,为业务提供高价值的数据服务。Step 6、标签优化:通过业务运营检验标签及权重分配的合理性,优化标签体系,同时通过业务的滋养,丰富、完善标签体系,进一步反哺业务运营。
整个标签层的建设中,我们要秉着以数据价值为导向,尊重数据可行性、业务可行性,约束、规范整个建设过程,体现出数据中台的价值魅力。