大数据-维度建模-业务限定与修饰词

个人理解

常规来说- 一个业务限定对应一张新的DWS表

如果加了修饰词,说明虽然业务过程里有多个业务过程

首先是划定数据域,确定有哪些域,根据分析指标的主题来划分

不同域中确定业务过程,其实就是站在不同的主体上去看相关的整个业务

比如设备域,就是以设备的视角->

  1. 每个工班上班、下班
  2. 每次作业明细 装卸进提移 多个业务过程

划分完之后,2会有多个业务过程,但是在事实表中设计时,合并成一张事实表。

业务过程完成之后,开始做原子指标, 就是对事实表做一些sum avg 和count等操作可以直接出的指标

但是在此基础上,我们针对原子指标做了一些优化: 原有的定义中, 朴素的原子指标的定义就是如上,但是现在我们加上修饰词

个人理解:

修饰词的作用是在做计算时,可以使用sum if来进行判断, 数据源还是来自于同一张表,只有一张事实表, 可以生成不同的原子指标

至于业务限定,就是说已经做好了事实表,需要与维表进行关联,但是需要使用where进行限定,然后再进行聚合,也就是说一张事实表分化为不同的dws表,

Q: 如果去分修饰词与业务限定

根据我从网上搜索到的信息,数仓建模中业务限定与修饰词的区别是:业务限定指的是统计维度以外指标的业务场景限定抽象,

修饰词属于一种修饰类型,如在日志域的访问终端类型下,有修饰词app、pc端等1。

业务限定是对原子指标的一种分类,

修饰词是对原子指标的一种细分2。

例如,销售额是一个原子指标,按照区域、时间、产品等维度进行业务限定,就可以得到不同的业务场景下的销售额指标,如广东省一季度手机销售额,北京市12月图书销售额等。而在每个业务场景下,还可以根据修饰词对销售额进行进一步的修饰,如广东省一季度手机销售额中的线上销售额、线下销售额等

举例: 原子指标:作业量

业务限定:设备、人员、船舶

修饰词:

设备: 龙门吊、吊桥

人员:龙门吊班、桥吊班

船舶:iECS,非iECS

业务限定用来区分不同的业务场景

修饰词用来限定同一业务场景下的不同细分

问题:为什么要把修饰词提前到原子指标上呢 ?

这样就变成,原子指标:iECS船舶的作业量 , 这样有什么好处呢

需要确定的是,所谓的原子指标、派生指标, 只是在确认逻辑而已

THE END