大家好,欢迎来到IT知识分享网。
这里写目录标题
一、基本定义
1、实体
从业务的角度讲,实体是为了满足分析的需要,抽象出来的概念,从业务中拆分出一个个实体,可以是现实存在的业务对象,如用户,商品,也可以是显示没有的,即虚拟的业务对象,如会员。
2、维度
维度是度量的基础,用来反应业务的一类属性,这类属性的集合构成一个维度,也可以称为一个实体对象,
3、业务过程
业务过程是指企业的业务活动事件,如下单,付款,退款等都是业务过程。通常业务过程是指企业活动中的事件,因此业务过程是一个不可拆分的行为事件。
4、统计粒度
定义数据汇总的程度。例如,如果统计维度为时间,则粒度为年、月、季、周、日等。
5、标签
标签是认为设定的,根据业务场景需求,对目标对象运用一定的算法,得到的高度精炼的特征值。
二、表
1、事实表
用来描述业务过程的详细信息。事实表体现实际数据或详细数值,一般由维度编码和事实数据组成,如订单表。
2、维度
维度表存放具有独立属性和层次结构的数据,一般由维度编码和对应的维度说明(标签)组成。
三、指标
1、原子指标
和度量含义相同,某一业务行为事件下的度量,是业务定义中不可拆分的指标,如销售金额、库存数量。
2、派生指标
修饰词和原子指标组合生成派生指标。如某个渠道的销售金额,渠道类型为修饰词,销售金额为原子指标,分销销售金额、智药通销售金额为派生指标
3、衍生原子指标
原子指标根据衍生词的计算口径加工得到的衍生原子指标。如近效期库存,近效期(所属业务单元内,当前日期距离失效期的时间不足6个月)为衍生词
4、基础指标
指表达业务实体原子量化属性的且不可再分的概念集合,如交易笔数、交易金额、交易用户数等。
5、复合指标
指建立在基础指标之上,通过一定运算规则形成的计算指标集合,如平均用户交易额、资产负债率等。
6、修饰词
修饰词用于派生指标和复合指标的定义,不含有计算口径。指除了统计维度以外指标的业务场景,如某个维表的属性字段,客户类型,渠道类型。
7、衍生词
衍生词用于修饰原子指标,带有计算口径。如近效期:所属业务单元内,当前日期距离失效期的时间不足6个月。近效期为衍生词
8、业务限定
统计的业务范围,用于筛选出符合业务规则的记录(类似于SQL中where后的条件,不包括时间区间)。原子指标是计算逻辑的标准化定义,业务限定则是条件限制的标准化定义。
四、指标与标签的区别
1、概念不同
- 指标是用来定义、评价和描述特定事物的一种标准或方式。它通常由名称和取值两部分构成,用于衡量和描述事物的数量和质量特性。指标的取值可以是定量的数值,也可以是有定性描述的语言。
- 标签则是人为设定的,对目标对象运用一定的规则得到的高度精炼的特征标识。标签通常是简短的文字或符号,用来快速识别或描述某个对象的特性。
2、构成不同
- 指标通常包括名称和取值两个部分,其中名称是对事物质与量两方面特点的命名,而取值是指标在具体时间、地域、条件下数量的表现。指标可以有单位或量纲,但有时也可能仅提供定性描述。如人的体质,指标名称为体重,指标的取值是200斤。
- 标签则是一个更简洁的形式,通常只包含一个或多个形容词或名词组成的特征标识,不直接体现具体的数值。标签通常不可量化的,孤立的,通过一定算法加工出来的标签一般没有单位和量纲,如将超过200斤的称为大胖子。
3、属性与特征不同
- 指标是ICT时代和BI时代的通用语言,用于监控、分析和评价特定的业务过程或实体。它是业务管理导向的,需要提前规划,并且广泛应用于战略目标、市场定位、业务监测等多个领域。
- 标签则是对指标的进一步产品化,它可以被视为指标的成品,面向数据应用端,用于标注、刻画、分类和特征提取。标签的应用非常广泛,如客户分群、画像构建等,且其评价与使用者的感受和应用结果紧密相关。
综上所述,指标是为了量化和描述事物而设计的,具有明确的结构和数值表达;而标签则是为了简化和快速识别事物而创建的,通常更加简洁和不带有具体数值的信息。两者都服务于数据管理和分析的目的,但在应用方式和目的上有所不同。
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/113941.html