開始研究BI,初學(xué)。會(huì)記錄一些概念性的文章。
1.多維數(shù)據(jù)集:多維數(shù)據(jù)集是聯(lián)機(jī)分析處理 (OLAP) 中的主要對(duì)象,是一項(xiàng)可對(duì)數(shù)據(jù)倉庫中的數(shù)據(jù)進(jìn)行快速訪問的技術(shù)。多維數(shù)據(jù)集是一個(gè)數(shù)據(jù)集合,通常從數(shù)據(jù)倉庫的子集構(gòu)造,并組織和匯總成一個(gè)由一組維度和度量值定義的多維結(jié)構(gòu)。2.維度(dimension):是多維數(shù)據(jù)集的結(jié)構(gòu)性特性。它們是事實(shí)數(shù)據(jù)表中用來描述數(shù)據(jù)的分類的有組織層次結(jié)構(gòu)(級(jí)別)。這些分類和級(jí)別描述了一些相似的成員集合,用戶將基于這些成員集合進(jìn)行分析。3.度量值:在多維數(shù)據(jù)集中,度量值是一組值,這些值基于多維數(shù)據(jù)集的事實(shí)數(shù)據(jù)表中的一列,而且通常為數(shù)字。此外,度量值是所分析的多維數(shù)據(jù)集的中心值。即,度量值是最終用戶瀏覽多維數(shù)據(jù)集時(shí)重點(diǎn)查看的數(shù)字?jǐn)?shù)據(jù)。您所選擇的度量值取決于最終用戶所請(qǐng)求的信息類型。一些常見的度量值有 sales、cost、expenditures 和 production count 等。4.元數(shù)據(jù):不同 OLAP 組件中的數(shù)據(jù)和應(yīng)用程序的結(jié)構(gòu)模型。元數(shù)據(jù)描述 OLTP 數(shù)據(jù)庫中的表、數(shù)據(jù)倉庫和數(shù)據(jù)集市中的多維數(shù)據(jù)集這類對(duì)象,還記錄哪些應(yīng)用程序引用不同的記錄塊。5.級(jí)別:級(jí)別是維度層次結(jié)構(gòu)的一個(gè)元素。級(jí)別描述了數(shù)據(jù)的層次結(jié)構(gòu),從數(shù)據(jù)的最高(匯總程度最大)級(jí)別直到最低(最詳細(xì))級(jí)別。6.數(shù)據(jù)挖掘:數(shù)據(jù)挖掘使您得以定義包含分組和預(yù)測規(guī)則的模型,以便應(yīng)用于關(guān)系數(shù)據(jù)庫或多維 OLAP 數(shù)據(jù)集中的數(shù)據(jù)。之后,這些預(yù)測模型便可用于自動(dòng)執(zhí)行復(fù)雜的數(shù)據(jù)分析,以找出幫助識(shí)別新機(jī)會(huì)并選擇有獲勝把握的機(jī)會(huì)的趨勢。7.多維 OLAP (MOLAP):MOLAP 存儲(chǔ)模式使得分區(qū)的聚合和其源數(shù)據(jù)的復(fù)本以多維結(jié)構(gòu)存儲(chǔ)在分析服務(wù)器計(jì)算機(jī)上。根據(jù)分區(qū)聚合的百分比和設(shè)計(jì),MOLAP 存儲(chǔ)模式為達(dá)到最快查詢響應(yīng)時(shí)間提供了潛在可能性??偠灾?,MOLAP 更加適合于頻繁使用的多維數(shù)據(jù)集中的分區(qū)和對(duì)快速查詢響應(yīng)的需要。8.關(guān)系 OLAP (ROLAP):ROLAP 存儲(chǔ)模式使得分區(qū)的聚合存儲(chǔ)在關(guān)系數(shù)據(jù)庫的表(在分區(qū)數(shù)據(jù)源中指定)中。但是,可為分區(qū)數(shù)據(jù)使用 ROLAP 存儲(chǔ)模式,而不在關(guān)系數(shù)據(jù)庫中創(chuàng)建聚合。9.混合 OLAP (HOLAP):HOLAP 存儲(chǔ)模式結(jié)合了 MOLAP 和 ROLAP 二者的特性。10.粒度:數(shù)據(jù)匯總的層次或深度。11.聚合|聚集:聚合是預(yù)先計(jì)算好的數(shù)據(jù)匯總,由于在問題提出之前已經(jīng)準(zhǔn)備了答案,聚合可以改進(jìn)查詢響應(yīng)時(shí)間。12.切塊:由多個(gè)維的多個(gè)成員限定的分區(qū)數(shù)據(jù),稱為一個(gè)切塊。13.切片(slice):由一個(gè)維的一個(gè)成員限定的分區(qū)數(shù)據(jù),稱為一個(gè)切片。14.數(shù)據(jù)鉆?。鹤罱K用戶從常規(guī)多維數(shù)據(jù)集、虛擬多維數(shù)據(jù)集或鏈接多維數(shù)據(jù)集中選擇單個(gè)單元,并從該單元的源數(shù)據(jù)中檢索結(jié)果集以獲得更詳細(xì)的信息,這個(gè)操作過程就是數(shù)據(jù)鉆取。15.數(shù)據(jù)挖掘模型:數(shù)據(jù)挖掘使您得以定義包含分組和預(yù)測規(guī)則的模型,以便應(yīng)用于關(guān)系數(shù)據(jù)庫或多維 OLAP 數(shù)據(jù)集中的數(shù)據(jù)。之后,這些預(yù)測模型便可用于自動(dòng)執(zhí)行復(fù)雜的數(shù)據(jù)分析,以找出幫助識(shí)別新機(jī)會(huì)并選擇有獲勝把握的機(jī)會(huì)的趨勢。
“數(shù)據(jù)庫維度”是與某個(gè)鍵屬性相關(guān)的維度屬性的集合,而該鍵屬性又與度量值維度中的事實(shí)數(shù)據(jù)相關(guān)。
每個(gè)數(shù)據(jù)倉庫都包含一個(gè)或者多個(gè)事實(shí)數(shù)據(jù)表。事實(shí)數(shù)據(jù)表可能包含業(yè)務(wù)銷售數(shù)據(jù),如現(xiàn)金登記事務(wù)所產(chǎn)生的數(shù)據(jù),事實(shí)數(shù)據(jù)表通常包含大量的行。事實(shí)數(shù)據(jù)表的主要特點(diǎn)是包含數(shù)字?jǐn)?shù)據(jù)(事實(shí)),并且這些數(shù)字信息可以匯總,以提供有關(guān)單位作為歷史的數(shù)據(jù),每個(gè)事實(shí)數(shù)據(jù)表包含一個(gè)由多個(gè)部分組成的索引,該索引包含作為外鍵的相關(guān)性緯度表的主鍵,而維度表包含事實(shí)記錄的特性。事實(shí)數(shù)據(jù)表不應(yīng)該包含描述性的信息,也不應(yīng)該包含除數(shù)字度量字段及使事實(shí)與緯度表中對(duì)應(yīng)項(xiàng)的相關(guān)索引字段之外的任何數(shù)據(jù)。包含在事實(shí)數(shù)據(jù)表中的“度量值”有兩中:一種是可以累計(jì)的度量值,另一種是非累計(jì)的度量值。最有用的度量值是可累計(jì)的度量值,其累計(jì)起來的數(shù)字是非常有意義的。用戶可以通過累計(jì)度量值獲得匯總信息,例如??梢詤R總具體時(shí)間段內(nèi)一組商店的特定商品的銷售情況。非累計(jì)的度量值也可以用于事實(shí)數(shù)據(jù)表,單匯總結(jié)果一般是沒有意義的,例如,在一座大廈的不同位置測量溫度時(shí),如果將大廈中所有不同位置的溫度累加是沒有意義的,但是求平均值是有意義的。一般來說,一個(gè)事實(shí)數(shù)據(jù)表都要和一個(gè)或多個(gè)緯度表相關(guān)聯(lián),用戶在利用事實(shí)數(shù)據(jù)表創(chuàng)建多維數(shù)據(jù)集時(shí),可以使用一個(gè)或多個(gè)維度表。
維度表可以看作是用戶來分析數(shù)據(jù)的窗口,緯度表中包含事實(shí)數(shù)據(jù)表中事實(shí)記錄的特性,有些特性提供描述性信息,有些特性指定如何匯總事實(shí)數(shù)據(jù)表數(shù)據(jù),以便為分析者提供有用的信息,維度表包含幫助匯總數(shù)據(jù)的特性的層次結(jié)構(gòu)。例如,包含產(chǎn)品信息的維度表通常包含將產(chǎn)品分為食品、飲料、非消費(fèi)品等若干類的層次結(jié)構(gòu),這些產(chǎn)品中的每一類進(jìn)一步多次細(xì)分,直到各產(chǎn)品達(dá)到最低級(jí)別。在維度表中,每個(gè)表都包含獨(dú)立于其他維度表的事實(shí) 特性,例如,客戶維度表包含有關(guān)客戶的數(shù)據(jù)。維度表中的列字段可以將信息分為不同層次的結(jié)構(gòu)級(jí)。
1、事實(shí)表就是你要關(guān)注的內(nèi)容;2、維度表就是你觀察該事務(wù)的角度,是從哪個(gè)角度去觀察這個(gè)內(nèi)容的。例如,某地區(qū)商品的銷量,是從地區(qū)這個(gè)角度觀察商品銷量的。事實(shí)表就是銷量表,維度表就是地區(qū)表。
本篇文章來源于:開發(fā)學(xué)院 http://edu.codepub.com 原文鏈接:http://edu.codepub.com/2009/1208/18557.php
聯(lián)系客服