大数据-维度建模-业务限定与修饰词
个人理解
常规来说- 一个业务限定对应一张新的DWS表
如果加了修饰词,说明虽然业务过程里有多个业务过程
首先是划定数据域,确定有哪些域,根据分析指标的主题来划分
不同域中确定业务过程,其实就是站在不同的主体上去看相关的整个业务
比如设备域,就是以设备的视角->
- 每个工班上班、下班
- 每次作业明细 装卸进提移 多个业务过程
划分完之后,2会有多个业务过程,但是在事实表中设计时,合并成一张事实表。
业务过程完成之后,开始做原子指标, 就是对事实表做一些sum avg 和count等操作可以直接出的指标
但是在此基础上,我们针对原子指标做了一些优化: 原有的定义中, 朴素的原子指标的定义就是如上,但是现在我们加上修饰词
个人理解:
修饰词的作用是在做计算时,可以使用sum if来进行判断, 数据源还是来自于同一张表,只有一张事实表, 可以生成不同的原子指标
至于业务限定,就是说已经做好了事实表,需要与维表进行关联,但是需要使用where进行限定,然后再进行聚合,也就是说一张事实表分化为不同的dws表,
Q: 如果去分修饰词与业务限定
根据我从网上搜索到的信息,数仓建模中业务限定与修饰词的区别是:业务限定指的是统计维度以外指标的业务场景限定抽象,
修饰词属于一种修饰类型,如在日志域的访问终端类型下,有修饰词app、pc端等1。
业务限定是对原子指标的一种分类,
修饰词是对原子指标的一种细分2。
例如,销售额是一个原子指标,按照区域、时间、产品等维度进行业务限定,就可以得到不同的业务场景下的销售额指标,如广东省一季度手机销售额,北京市12月图书销售额等。而在每个业务场景下,还可以根据修饰词对销售额进行进一步的修饰,如广东省一季度手机销售额中的线上销售额、线下销售额等
举例: 原子指标:作业量
业务限定:设备、人员、船舶
修饰词:
设备: 龙门吊、吊桥
人员:龙门吊班、桥吊班
船舶:iECS,非iECS
业务限定用来区分不同的业务场景
修饰词用来限定同一业务场景下的不同细分
问题:为什么要把修饰词提前到原子指标上呢 ?
这样就变成,原子指标:iECS船舶的作业量 , 这样有什么好处呢
需要确定的是,所谓的原子指标、派生指标, 只是在确认逻辑而已