SSB 数据集
Kyligence 为您一套标准的 SSB 数据集用于试用,该数据集的事实表包含 6 万行数据,本章节将为您介绍 SSB 数据集的数据字典。
SSB 数据集包含 5 张表:
- P_LINEORDER 事实表,描述销售订单的明细信息,每一行对应着一笔交易订单,包含了客户、供应商、订单金额、销售日期等信息。
P_LINEORDER 字段 |
含义 |
ORDERKEY |
订单ID |
CUSTKEY |
顾客ID |
PARTKEY |
零件ID |
SUPPKEY |
供应商ID |
ORDERDATE |
订单日期 |
ORDERPRIORITY |
订单优先级 |
SHIPPRIORITY |
交易优先级 |
QUANTITY |
数量 |
EXTENDEDPRICE |
额外费用 |
ORDTOTALPRICE |
订单总额 |
DISCOUNT |
折扣 |
REVENUE |
收入 |
SUPPLYCOST |
供应成本 |
TAX |
税率 |
COMMITDATE |
交易日期 |
SHIPMODE |
交易模式 |
V_REVENUE |
虚拟收入 |
- CUSTOMER 维度表,描述用户的信息,包含用户名称、地址、城市等。
CUSTOMER 字段 |
含义 |
CUSTKEY |
客户ID |
NAME |
客户名称 |
ADDRESS |
客户地址 |
CITY |
客户城市 |
NATION_PREFIX |
国家代号 |
NATION |
国家 |
REGION |
区域 |
PHONE |
电话 |
MKTSEGMENT |
市场部门 |
- SUPPLIER 维度表,描述供应商的详细介绍,例如供应商名称、地址、电话等。
SUPPLIER 字段 |
含义 |
SUPPKEY |
供应商ID |
NAME |
供应商名称 |
ADDRESS |
供应商地址 |
CITY |
供应商城市 |
NATION_PREFIX |
国家代号 |
NATION |
国家 |
REGION |
区域 |
PHONE |
电话 |
- DATE 维度表,描述了近七年的日期信息。如某个日期所在的年份、月份、星期等。
DATE 字段 |
含义 |
DATEKEY |
日期ID |
DATE |
日期 |
DAYOFWEEK |
星期几 |
MONTH |
月份 |
YEAR |
年份 |
YEARMONTHNUM |
年份数 |
YEARMONTH |
年月数 |
DAYNUMINWEEK |
周天数 |
DAYNUMINMONTH |
月天数 |
DAYNUMINYEAR |
年天数 |
MONTHINYEAR |
年月数 |
WEEKNUMINYEAR |
年周数 |
SELLINGSEASON |
出售季节 |
LASTDAYINWEEKFL |
星期最后一天 |
LASTDAYINMONTHFL |
月份最后一天 |
HOLIDAYFL |
假日 |
WEEKDAYFL |
工作日 |
- PART 维度表,描述了零件信息,如零件的名称、类别、颜色、型号等。
PART 字段 |
含义 |
PARTKEY |
零件ID |
NAME |
零件名称 |
MFGR |
生产商 |
CATEGORY |
种类 |
BRAND |
品牌 |
COLOR |
颜色 |
TYPE |
类型 |
SIZE |
型号 |
CONTAINER |
容量 |
这 5 张表共同构成了星型模型的结构。下面是它们的关系图:
本教程所用度量的计算公式如下:
度量 |
计算公式 |
TESTMEASURE0 |
SUM(P_LINEORDER.LO_REVENUE) |
TESTMEASURE1 |
SUM(P_LINEORDER.LO_SUPPLYCOST) |
TESTMEASURE2 |
SUM(P_LINEORDER.V_REVENUE) |
TESTMEASURE3 |
COUNT(DISTINCT P_LINEORDER.LO_CUSTKEY) |