国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
數(shù)據(jù)倉庫基礎(chǔ)知識(shí)
數(shù)據(jù)倉庫
數(shù)據(jù)倉庫(Data Warehouse)是一個(gè)面向主題的(SubjectOriented)、集成的Integrate)、相對(duì)穩(wěn)定的(Non-Volatile)、反映歷史變化(TimeVariant)的數(shù)據(jù)集合,用于支持管理決策。

數(shù)據(jù)倉庫是在企業(yè)管理和決策中面向主題的、集成的、與時(shí)間相關(guān)的、不可修改的數(shù)據(jù)集合?!獢?shù)據(jù)倉庫之父--BillInmon

數(shù)據(jù)倉庫基本特性
面向主題性
面向主題性表示了數(shù)據(jù)倉庫中數(shù)據(jù)組織的基本原則,數(shù)據(jù)倉庫中的所有數(shù)據(jù)都是圍繞著某一主題組織的。 
確定主題以后,需要確定主題應(yīng)該包含的數(shù)據(jù)。 
不同的主題之間可能會(huì)出現(xiàn)相互重疊的信息。 
主題在數(shù)據(jù)倉庫中可以用多維數(shù)據(jù)庫方式進(jìn)行存儲(chǔ)。
主題的劃分中,必須保證每一個(gè)主題的獨(dú)立性。 

一個(gè)主題領(lǐng)域的表來源于多個(gè)操作型應(yīng)用(如:客戶主題,來源于:定單處理;應(yīng)收帳目;應(yīng)付帳目;…);
典型的主題領(lǐng)域:客戶;產(chǎn)品;交易;帳目;
主題領(lǐng)域以一組相關(guān)的表來具體實(shí)現(xiàn);
相關(guān)的表通過公共的鍵碼聯(lián)系起來(如:顧客標(biāo)識(shí)號(hào)Customer ID);
每個(gè)鍵碼都有時(shí)間元素(從日期到日期;每月累積;單獨(dú)日期…);
主題內(nèi)數(shù)據(jù)可以存儲(chǔ)在不同介質(zhì)上(綜合級(jí),細(xì)節(jié)級(jí),多粒度);

數(shù)據(jù)集成性
根據(jù)決策分析的要求,將分散于各處的源數(shù)據(jù)進(jìn)行抽取、篩選、清理、綜合等工作,最終集成到數(shù)據(jù)倉庫中。 


數(shù)據(jù)的時(shí)變性
數(shù)據(jù)應(yīng)該隨著時(shí)間的推移而發(fā)生變化,不斷地生成主題的新快照。


數(shù)據(jù)的非易失性
數(shù)據(jù)的相對(duì)穩(wěn)定性。
數(shù)據(jù)倉庫中的數(shù)據(jù)只進(jìn)行刷新,從不進(jìn)行更新處理。
反映歷史變化。

數(shù)據(jù)庫與數(shù)據(jù)倉庫的對(duì)比


商務(wù)智能
簡單定義:綜合企業(yè)所有沉淀下來的信息,用科學(xué)的分析方法,為企業(yè)領(lǐng)導(dǎo)提供科學(xué)決策信息的過程。 
完整定義:基于數(shù)據(jù)倉庫技術(shù)的決策支持系統(tǒng)(DSS)。它以數(shù)據(jù)倉庫(DW)技術(shù)為基礎(chǔ),通過抽取、轉(zhuǎn)換和清洗將分散在企業(yè)各處的數(shù)據(jù)整合在一起,轉(zhuǎn)化為信息;進(jìn)而以聯(lián)機(jī)分析處理(OLAP)工具、數(shù)據(jù)挖掘(DM)工具、報(bào)表工具為手段將信息提升為知識(shí);最后運(yùn)用可視化技術(shù)以快捷直觀的方式將探察分析結(jié)果呈現(xiàn)給最終用戶,為管理決策層提供量化依據(jù)的過程。

數(shù)據(jù)挖掘
數(shù)據(jù)挖掘使您得以定義包含分組和預(yù)測規(guī)則的模型,以便應(yīng)用于關(guān)系數(shù)據(jù)庫或多維 OLAP數(shù)據(jù)集中的數(shù)據(jù)。之后,這些預(yù)測模型便可用于自動(dòng)執(zhí)行復(fù)雜的數(shù)據(jù)分析,以找出幫助識(shí)別新機(jī)會(huì)并選擇有獲勝把握的機(jī)會(huì)的趨勢。

聯(lián)機(jī)事務(wù)處理(OLTP)
OLTP系統(tǒng)是設(shè)計(jì)用來允許高并發(fā)性的,這樣很多用戶就能夠訪問同一個(gè)數(shù)據(jù)源并進(jìn)行所需的處理。
OLTP系統(tǒng)是面向在數(shù)據(jù)庫上進(jìn)行事務(wù)處理的理念的。而事務(wù)則進(jìn)一步蘊(yùn)含著發(fā)生在表中數(shù)據(jù)上的受控的變更,這些變更包括在商務(wù)運(yùn)作過程中發(fā)生的插入、更新和刪除操作。通常,一個(gè)OLTP系統(tǒng)將會(huì)有大量的客戶端應(yīng)用程序通過各種各樣的方式(插入、更新、刪除--實(shí)際上可以是任何操作)訪問數(shù)據(jù)庫以查詢一小塊信息。
OLTP系統(tǒng)的實(shí)例包括數(shù)據(jù)輸入程序,如銀行處理、訂票、聯(lián)機(jī)銷售和庫存管理系統(tǒng)。

聯(lián)機(jī)分析處理(OLAP)
聯(lián)機(jī)分析處理(或OLAP)是一種廣義上的決策支持系統(tǒng)(DSS),或者最近越來越流行的商業(yè)智能(BI)。BI系統(tǒng)的目標(biāo)是分析海量數(shù)據(jù),然后以很多不同的方式(包括每天、每周、每季和年度報(bào)告)生成小結(jié)和總結(jié)以把精力高度集中在記分卡和儀表盤上,它們通常用于幫助那些準(zhǔn)備好根據(jù)這些數(shù)據(jù)采取一定的措施的特定用戶來獲取競爭優(yōu)勢。
一旦數(shù)據(jù)進(jìn)入數(shù)據(jù)倉庫之后就很少會(huì)發(fā)生變化。數(shù)據(jù)被保存在那里用于查詢和生成報(bào)表,以便幫助決策者規(guī)劃企業(yè)的未來。它不需要關(guān)心插入、更新和刪除操作。因此與高度規(guī)范的事務(wù)數(shù)據(jù)庫不同,在這種情況下通常會(huì)使用所謂的維度數(shù)據(jù)庫(dimensional database),它將遵循特定的結(jié)構(gòu)或模式。
維度數(shù)據(jù)庫可以用來構(gòu)建數(shù)據(jù)立方體,數(shù)據(jù)立方體是數(shù)據(jù)的多維表示,用來方便聯(lián)機(jī)業(yè)務(wù)分析和提高查詢性能。立方體中的每一維都表示業(yè)務(wù)數(shù)據(jù)中的一個(gè)不同的分析類別。

維度數(shù)據(jù)庫
在OLTP系統(tǒng)中進(jìn)行復(fù)雜查詢存在一些固有的問題,對(duì)這些問題的解決方案是構(gòu)建一個(gè)單獨(dú)的數(shù)據(jù)庫來更簡潔地表示業(yè)務(wù)事實(shí)(fact)。這個(gè)數(shù)據(jù)庫的結(jié)構(gòu)不是關(guān)系型的,相反,它是維度化的。

ETL
  數(shù)據(jù)抽?。‥xtract)、轉(zhuǎn)換(Transform)、清洗(Cleansing)、裝載(Load)的過程。是構(gòu)建數(shù)據(jù)倉庫的重要一環(huán),用戶從數(shù)據(jù)源抽取出所需的數(shù)據(jù),經(jīng)過數(shù)據(jù)清洗,最終按照預(yù)先定義好的數(shù)據(jù)倉庫模型,將數(shù)據(jù)加載到數(shù)據(jù)倉庫中去。

元數(shù)據(jù)(Meta Data)
  關(guān)于數(shù)據(jù)倉庫的數(shù)據(jù),指在數(shù)據(jù)倉庫建設(shè)過程中所產(chǎn)生的有關(guān)數(shù)據(jù)源定義,目標(biāo)定義,轉(zhuǎn)換規(guī)則等相關(guān)的關(guān)鍵數(shù)據(jù)。同時(shí)元數(shù)據(jù)還包含關(guān)于數(shù)據(jù)含義的商業(yè)信息,所有這些信息都應(yīng)當(dāng)妥善保存,并很好地管理。為數(shù)據(jù)倉庫的發(fā)展和使用提供方便。
  關(guān)于數(shù)據(jù)的數(shù)據(jù),用于構(gòu)造、維持、管理、和使用數(shù)據(jù)倉庫,在數(shù)據(jù)倉庫中尤為重要。
   不同 OLAP組件中的數(shù)據(jù)和應(yīng)用程序的結(jié)構(gòu)模型。元數(shù)據(jù)描述 OLTP數(shù)據(jù)庫中的表、數(shù)據(jù)倉庫和數(shù)據(jù)集市中的多維數(shù)據(jù)集這類對(duì)象,還記錄哪些應(yīng)用程序引用不同的記錄塊。

數(shù)據(jù)集市(Data mart)
   數(shù)據(jù)集市 --小型的,面向部門或工作組級(jí)數(shù)據(jù)倉庫。
  即”小數(shù)據(jù)倉庫”。如果說數(shù)據(jù)倉庫是建立在企業(yè)級(jí)的數(shù)據(jù)模型之上的話。那么數(shù)據(jù)集市就是企業(yè)級(jí)數(shù)據(jù)倉庫的一個(gè)子集,他主要面向部門級(jí)業(yè)務(wù),并且只是面向某個(gè)特定的主題。數(shù)據(jù)集市可以在一定程度上緩解訪問數(shù)據(jù)倉庫的瓶頸。

ODS
Operation Data Store,操作數(shù)據(jù)存儲(chǔ) —ODS是能支持企業(yè)日常的全局應(yīng)用的數(shù)據(jù)集合,是不同于DB的一種新的數(shù)據(jù)環(huán)境, 是DW擴(kuò)展后得到的一個(gè)混合形式。四個(gè)基本特點(diǎn):面向主題的(Subject -Oriented)、集成的、可變的、當(dāng)前或接近當(dāng)前的。
   
主題(SUBJECT)
  是一個(gè)在較高層次將數(shù)據(jù)歸類的標(biāo)準(zhǔn),每一個(gè)主題對(duì)應(yīng)一個(gè)宏觀的分析領(lǐng)域,針對(duì)具體決策需求可細(xì)化為多個(gè)主題表,具體來說就是確定決策涉及的范圍和所要解決的問題。 

多維數(shù)據(jù)集
多維數(shù)據(jù)集是聯(lián)機(jī)分析處理 (OLAP)中的主要對(duì)象,是一項(xiàng)可對(duì)數(shù)據(jù)倉庫中的數(shù)據(jù)進(jìn)行快速訪問的技術(shù)。多維數(shù)據(jù)集是一個(gè)數(shù)據(jù)集合,通常從數(shù)據(jù)倉庫的子集構(gòu)造,并組織和匯總成一個(gè)由一組維度和度量值定義的多維結(jié)構(gòu)。

維度(DIMENSION)
   是人們觀察數(shù)據(jù)的特定角度,是考慮問題時(shí)的一類屬性,屬性集合構(gòu)成一個(gè)維(時(shí)間維、地理維等)。
   是多維數(shù)據(jù)集的結(jié)構(gòu)性特性。它們是事實(shí)數(shù)據(jù)表中用來描述數(shù)據(jù)的分類的有組織層次結(jié)構(gòu)(級(jí)別)。這些分類和級(jí)別描述了一些相似的成員集合,用戶將基于這些成員集合進(jìn)行分析。
   這詞,英國著名物理學(xué)家史蒂芬·霍金教授有這樣的解釋:這就像一根頭發(fā),遠(yuǎn)看是一維的線,在放大鏡下,它確實(shí)是三維的;如果面對(duì)時(shí)空,如果有足夠高倍的放大鏡的話,也應(yīng)該能揭示出其它可能存在的4維、5維空間,直至11維空間。因此,維度是指一種視角,而不是一個(gè)固定的數(shù)字;是一個(gè)判斷、說明、評(píng)價(jià)和確定一個(gè)事物的多方位、多角度、多層次的條件和概念

事實(shí)表
每個(gè)數(shù)據(jù)倉庫都包含一個(gè)或者多個(gè)事實(shí)數(shù)據(jù)表。事實(shí)數(shù)據(jù)表可能包含業(yè)務(wù)銷售數(shù)據(jù),如現(xiàn)金登記事務(wù)
所產(chǎn)生的數(shù)據(jù),事實(shí)數(shù)據(jù)表通常包含大量的行。事實(shí)數(shù)據(jù)表的主要特點(diǎn)是包含數(shù)字?jǐn)?shù)據(jù)(事實(shí)),并且這些數(shù)字信息可以匯總,以提供有關(guān)單位作為歷史的數(shù)據(jù),每個(gè)事實(shí)數(shù)據(jù)表包含一個(gè)由多個(gè)部分組成的索引,該索引包含作為外鍵的相關(guān)性緯度表的主鍵,而維度表包含事實(shí)記錄的特性。事實(shí)數(shù)據(jù)表不應(yīng)該包含描述性的信息,也不應(yīng)該包含除數(shù)字度量字段及使事實(shí)與緯度表中對(duì)應(yīng)項(xiàng)的相關(guān)索引字段之外的任何數(shù)據(jù)。
包含在事實(shí)數(shù)據(jù)表中的“度量值”有兩中:一種是可以累計(jì)的度量值,另一種是非累計(jì)的度量值。最有用的度量值是可累計(jì)的度量值,其累計(jì)起來的數(shù)字是非常有意義的。用戶可以通過累計(jì)度量值獲得匯總信息,例如??梢詤R總具體時(shí)間段內(nèi)一組商店的特定商品的銷售情況。非累計(jì)的度量值也可以用于事實(shí)數(shù)據(jù)表,單匯總結(jié)果一般是沒有意義的,例如,在一座大廈的不同位置測量溫度時(shí),如果將大廈中所有不同位置的溫度累加是沒有意義的,但是求平均值是有意義的。
一般來說,一個(gè)事實(shí)數(shù)據(jù)表都要和一個(gè)或多個(gè)緯度表相關(guān)聯(lián),用戶在利用事實(shí)數(shù)據(jù)表創(chuàng)建多維數(shù)據(jù)集時(shí),可以使用一個(gè)或多個(gè)維度表。
從用途的不同來說,事實(shí)表可以分為三類,分別是原子事實(shí)表,聚集事實(shí)表和合并事實(shí)表。
原子事實(shí)表(Atom FactTable)是保存最細(xì)粒度數(shù)據(jù)的事實(shí)表,也是數(shù)據(jù)倉庫中保存原子信息的場所。
聚集事實(shí)表(Aggregated FactTable)是原子事實(shí)表上的匯總數(shù)據(jù),也稱為匯總事實(shí)表。即新建立一個(gè)事實(shí)表,它的維度表是比原維度表要少,或者某些維度表是原維度表的子集,如用月份維度表代替日期維度表;事實(shí)數(shù)據(jù)是相應(yīng)事實(shí)的匯總,即求和或求平均值等。在做數(shù)據(jù)遷移時(shí),當(dāng)相關(guān)的維度數(shù)據(jù)和事實(shí)數(shù)據(jù)發(fā)生變化時(shí),聚集事實(shí)表需要做相應(yīng)的刷新。物化視圖是實(shí)現(xiàn)聚集事實(shí)表的一種有效方式,可以設(shè)定刷新方式,具體功能由DBMS來實(shí)現(xiàn)。
合并事實(shí)表(Consolidated FactTable)是指將位于不同事實(shí)表中處于相同粒度的事實(shí)進(jìn)行組合建模而成的一種事實(shí)表。即新建立一個(gè)事實(shí)表,它的維度是兩個(gè)或多個(gè)事實(shí)表的相同維度的集合;事實(shí)是幾個(gè)事實(shí)表中感興趣的事實(shí)。在Kimball的總線架構(gòu)中,由合并事實(shí)表為主組成的合并數(shù)據(jù)集市稱為二級(jí)數(shù)據(jù)集市。合并事實(shí)表的粒度可以是原子粒度也可以是聚集粒度。在做數(shù)據(jù)遷移時(shí),當(dāng)相關(guān)的原子事實(shí)表的數(shù)據(jù)有改變時(shí),合并事實(shí)表的數(shù)據(jù)需要重新刷新。合并事實(shí)表和交叉探察是兩個(gè)互補(bǔ)的操作。
聚集事實(shí)表和合并事實(shí)表的主要差別是合并事實(shí)表一般是從多個(gè)事實(shí)表合并而來。但是它們的差別不是絕對(duì)的,一個(gè)事實(shí)表既是聚集事實(shí)表又是合并事實(shí)表是很有可能的。因?yàn)橐话愫喜⑹聦?shí)表需要按相同的維度合并,所以很可能在做合并的同時(shí)需要進(jìn)行聚集,即粒度變粗。

維度表
維度表可以看作是用戶來分析數(shù)據(jù)的窗口,緯度表中包含事實(shí)數(shù)據(jù)表中事實(shí)記錄的特性,有些特性提供描述性信息,有些特性指定如何匯總事實(shí)數(shù)據(jù)表數(shù)據(jù),以便為分析者提供有用的信息,維度表包含幫助匯總數(shù)據(jù)的特性的層次結(jié)構(gòu)。例如,包含產(chǎn)品信息的維度表通常包含將產(chǎn)品分為食品、飲料、非消費(fèi)品等若干類的層次結(jié)構(gòu),這些產(chǎn)品中的每一類進(jìn)一步多次細(xì)分,直到各產(chǎn)品達(dá)到最低級(jí)別。
在維度表中,每個(gè)表都包含獨(dú)立于其他維度表的事實(shí)特性,例如,客戶維度表包含有關(guān)客戶的數(shù)據(jù)。維度表中的列字段可以將信息分為不同層次的結(jié)構(gòu)級(jí)。
結(jié)論:
1、事實(shí)表就是你要關(guān)注的內(nèi)容;
2、維度表就是你觀察該事務(wù)的角度,是從哪個(gè)角度去觀察這個(gè)內(nèi)容的。
例如,某地區(qū)商品的銷量,是從地區(qū)這個(gè)角度觀察商品銷量的。事實(shí)表就是銷量表,維度表就是地區(qū)表。

度量值
在多維數(shù)據(jù)集中,度量值是一組值,這些值基于多維數(shù)據(jù)集的事實(shí)數(shù)據(jù)表中的一列,而且通常為數(shù)字。此外,度量值是所分析的多維數(shù)據(jù)集的中心值。即,度量值是最終用戶瀏覽多維數(shù)據(jù)集時(shí)重點(diǎn)查看的數(shù)字?jǐn)?shù)據(jù)。您所選擇的度量值取決于最終用戶所請(qǐng)求的信息類型。一些常見的度量值有sales、cost、expenditures 和 production count 等。
“度量值”是來自事實(shí)數(shù)據(jù)表的值,也稱為“事實(shí)數(shù)據(jù)”。度量值維度的值有時(shí)也通稱為“成員”。度量值通常是數(shù)值,但也可以是字符串值。

Measures 維度 (Measures dimension)
“度量值維度”是包含多維數(shù)據(jù)集中所有度量值的維度。度量值維度是一種特殊的維度,其中的成員通常是根據(jù)各個(gè)維度屬性(存在指定的度量值)的當(dāng)前成員(通常采用求和或計(jì)數(shù)方式)進(jìn)行聚合。

度量值組 (Measure Group)
“度量值組”是 SQL Server 2005 Analysis Services多維數(shù)據(jù)集中的相關(guān)度量值集合(通常是來自同一事實(shí)數(shù)據(jù)表的度量值)。在 SQL Server 2005 AnalysisServices 中,一個(gè)多維數(shù)據(jù)集可包含多個(gè)度量值組。

級(jí)別
級(jí)別是維度層次結(jié)構(gòu)的一個(gè)元素。級(jí)別描述了數(shù)據(jù)的層次結(jié)構(gòu),從數(shù)據(jù)的最高(匯總程度最大)級(jí)別直到最低(最詳細(xì))級(jí)別。

多維 OLAP (MOLAP):MOLAP存儲(chǔ)模式使得分區(qū)的聚合和其源數(shù)據(jù)的復(fù)本以多維結(jié)構(gòu)存儲(chǔ)在分析服務(wù)器計(jì)算機(jī)上。根據(jù)分區(qū)聚合的百分比和設(shè)計(jì),MOLAP存儲(chǔ)模式為達(dá)到最快查詢響應(yīng)時(shí)間提供了潛在可能性。總而言之,MOLAP更加適合于頻繁使用的多維數(shù)據(jù)集中的分區(qū)和對(duì)快速查詢響應(yīng)的需要。

關(guān)系 OLAP (ROLAP):ROLAP存儲(chǔ)模式使得分區(qū)的聚合存儲(chǔ)在關(guān)系數(shù)據(jù)庫的表(在分區(qū)數(shù)據(jù)源中指定)中。但是,可為分區(qū)數(shù)據(jù)使用 ROLAP存儲(chǔ)模式,而不在關(guān)系數(shù)據(jù)庫中創(chuàng)建聚合。

混合 OLAP (HOLAP):HOLAP 存儲(chǔ)模式結(jié)合了 MOLAP 和 ROLAP二者的特性。

粒度
數(shù)據(jù)匯總的層次或深度。數(shù)據(jù)倉庫的數(shù)據(jù)單位中保存數(shù)據(jù)的細(xì)化或綜合程度的級(jí)別。細(xì)化程度越高,粒度越小。

聚合|聚集:聚合是預(yù)先計(jì)算好的數(shù)據(jù)匯總,由于在問題提出之前已經(jīng)準(zhǔn)備了答案,聚合可以改進(jìn)查詢響應(yīng)時(shí)間。

分割
數(shù)據(jù)分散到各自的物理單元中去,它們能獨(dú)立地處理。

切塊:由多個(gè)維的多個(gè)成員限定的分區(qū)數(shù)據(jù),稱為一個(gè)切塊。

切片:由一個(gè)維的一個(gè)成員限定的分區(qū)數(shù)據(jù),稱為一個(gè)切片。

數(shù)據(jù)鉆取:最終用戶從常規(guī)多維數(shù)據(jù)集、虛擬多維數(shù)據(jù)集或鏈接多維數(shù)據(jù)集中選擇單個(gè)單元,并從該單元的源數(shù)據(jù)中檢索結(jié)果集以獲得更詳細(xì)的信息,這個(gè)操作過程就是數(shù)據(jù)鉆取。

數(shù)據(jù)挖掘模型:數(shù)據(jù)挖掘使您得以定義包含分組和預(yù)測規(guī)則的模型,以便應(yīng)用于關(guān)系數(shù)據(jù)庫或多維 OLAP數(shù)據(jù)集中的數(shù)據(jù)。之后,這些預(yù)測模型便可用于自動(dòng)執(zhí)行復(fù)雜的數(shù)據(jù)分析,以找出幫助識(shí)別新機(jī)會(huì)并選擇有獲勝把握的機(jī)會(huì)的趨勢。

數(shù)據(jù)庫維度 (Database dimension)
“數(shù)據(jù)庫維度”是與某個(gè)鍵屬性相關(guān)的維度屬性的集合,而該鍵屬性又與度量值維度中的事實(shí)數(shù)據(jù)相關(guān)。

維度屬性 (Dimension attribute)
“維度屬性”被綁定到維度表中的一個(gè)或多個(gè)列并包含成員。維度屬性可以包含客戶名稱、月份名稱和產(chǎn)品名稱。

成員 (Member)
“成員”是維度屬性(包括度量值維度)的值。層次結(jié)構(gòu)中的成員可以是葉成員、父成員、數(shù)據(jù)成員或“(全部)”成員。

“(全部)”成員 ((All) member)
“(全部)”成員是屬性層次結(jié)構(gòu)或用戶定義的層次結(jié)構(gòu)中的所有成員的計(jì)算值。

計(jì)算成員 (Calculated member)
“計(jì)算成員”是在查詢時(shí)定義和計(jì)算的維度成員。可以在用戶查詢或 MDX 計(jì)算腳本中定義計(jì)算成員,并將其存儲(chǔ)在服務(wù)器上。一個(gè)計(jì)算成員對(duì)應(yīng)于定義它們的維度中的多個(gè)維度表行。

數(shù)據(jù)成員 (Data member)
“數(shù)據(jù)成員”是在父子層次結(jié)構(gòu)中與父成員相關(guān)聯(lián)的子成員。數(shù)據(jù)成員包含其父成員的數(shù)據(jù)值,而不是該父成員的子級(jí)的聚合值。

父成員 (Parent member)
“父成員”是父子層次結(jié)構(gòu)中的成員,包含其子級(jí)的聚合值。

葉成員 (leaf member)
“葉成員”是層次結(jié)構(gòu)中不包含子級(jí)的成員。

子成員 (Child member)
“子成員”是層次結(jié)構(gòu)中位于頂層下面的成員。

鍵屬性 (Key attribute)
數(shù)據(jù)庫維度的“鍵屬性”是維度中的所有非鍵屬性(以直接或間接方式)所鏈接到的屬性。鍵屬性通常也是粒度屬性。

粒度屬性 (Granularity attribute)
多維數(shù)據(jù)集維度的屬性,它將維度鏈接到度量值維度內(nèi)度量值組中的事實(shí)數(shù)據(jù)。如果粒度屬性和鍵屬性為不同的屬性,則非鍵屬性必須直接或間接地鏈接到粒度屬性。在多維數(shù)據(jù)集中,粒度屬性定義維度的粒度。

多維數(shù)據(jù)集維度 (Cube dimension)
“多維數(shù)據(jù)集維度”是多維數(shù)據(jù)集中的數(shù)據(jù)庫維度實(shí)例。

屬性層次結(jié)構(gòu) (Attribute hierarchy)
“屬性層次結(jié)構(gòu)”是包含以下級(jí)別的屬性成員層次結(jié)構(gòu):

數(shù)據(jù)倉庫建模 — 星型模式
Example of Star Schema
在多維分析的商業(yè)智能解決方案中,根據(jù)事實(shí)表和維度表的關(guān)系,又可將常見的模型分為星型模型和雪花型模型。在設(shè)計(jì)邏輯型數(shù)據(jù)的模型的時(shí)候,就應(yīng)考慮數(shù)據(jù)是按照星型模型還是雪花型模型進(jìn)行組織。
當(dāng)所有維表都直接連接到“事實(shí)表”上時(shí),整個(gè)圖解就像星星一樣,故將該模型稱為星型模型,星型架構(gòu)是一種非正規(guī)化的結(jié)構(gòu),多維數(shù)據(jù)集的每一個(gè)維度都直接與事實(shí)表相連接,不存在漸變維度,所以數(shù)據(jù)有一定的冗余,如在地域維度表中,存在國家A 省 B 的城市 C 以及國家 A 省 B 的城市 D 兩條記錄,那么國家 A 和省 B的信息分別存儲(chǔ)了兩次,即存在冗余。



數(shù)據(jù)倉庫建模 — 雪片模式
Example of Snowflake Schema
當(dāng)有一個(gè)或多個(gè)維表沒有直接連接到事實(shí)表上,而是通過其他維表連接到事實(shí)表上時(shí),其圖解就像多個(gè)雪花連接在一起,故稱雪花模型。雪花模型是對(duì)星型模型的擴(kuò)展。它對(duì)星型模型的維表進(jìn)一步層次化,原有的各維表可能被擴(kuò)展為小的事實(shí)表,形成一些局部的" 層次 " 區(qū)域,這些被分解的表都連接到主維度表而不是事實(shí)表。將地域維表又分解為國家,省份,城市等維表。它的優(yōu)點(diǎn)是 :通過最大限度地減少數(shù)據(jù)存儲(chǔ)量以及聯(lián)合較小的維表來改善查詢性能。雪花型結(jié)構(gòu)去除了數(shù)據(jù)冗余。

星型模型因?yàn)閿?shù)據(jù)的冗余所以很多統(tǒng)計(jì)查詢不需要做外部的連接,因此一般情況下效率比雪花型模型要高。星型結(jié)構(gòu)不用考慮很多正規(guī)化的因素,設(shè)計(jì)與實(shí)現(xiàn)都比較簡單。雪花型模型由于去除了冗余,有些統(tǒng)計(jì)就需要通過表的聯(lián)接才能產(chǎn)生,所以效率不一定有星型模型高。正規(guī)化也是一種比較復(fù)雜的過程,相應(yīng)的數(shù)據(jù)庫結(jié)構(gòu)設(shè)計(jì)、數(shù)據(jù)的ETL、以及后期的維護(hù)都要復(fù)雜一些。因此在冗余可以接受的前提下,實(shí)際運(yùn)用中星型模型使用更多,也更有效率。

參考文獻(xiàn):
Inmon,W.H.,” Building the Data Warehouse” ,Johm Wiley andSons,1996.
Ladley,John,”O(jiān)perational Data Stores:Building an EffectiveStrategy”,Data warehouse:Pratical Advice form the Experts,PrenticeHall,Englewood Cliffs,NJ,1997.
Gardmer,Stephen R., “Building the Datawarehouse”,Communication of ACM, September 1998, Volume 41, Numver9, 52-60.
Douglas Hackney , Http:// www.egltd.com, DW101: A PracticalOverview, 2001
 Pieter R. Mimno, “The Big Picture - How BrioCompetes in the Data Warehousing Market”, Presentation to BrioTechnology - August 4, 1998.
Alex Berson, Stephen Smith, Kurt Therling, “Building DataMining Application for CRM”, McGraw-Hill, 1999
Martin Stardt, Anca Vaduva, Thomas Vetterli, “The Role of Metafor Data Warehouse”, 2000
W.H.Inmon, Ken Rudin, Christopher K. Buss, Ryan Sousa, “DataWarehouse Performance”, John Wiley & Sons ,1999
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
維度模型數(shù)據(jù)倉庫基礎(chǔ)對(duì)象概念一覽
SQL Server數(shù)據(jù)倉庫相關(guān)概念-維度表和事實(shí)表概述
大數(shù)據(jù)數(shù)據(jù)倉庫建設(shè)方案
數(shù)據(jù)倉庫-事實(shí)表/維度表技術(shù)-讀書筆記三
數(shù)據(jù)倉庫(二)之維度建模篇
關(guān)于數(shù)倉建設(shè)及數(shù)據(jù)治理的超全概括
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服