国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看
打開APP
未登錄
開通VIP,暢享免費電子書等14項超值服
開通VIP
首頁
好書
留言交流
下載APP
聯(lián)系客服
維度建模的10大基本原則
jinhao2003
>《我的圖書館》
2009.10.13
關注
【IT168
技術
分析】
遵循這些原則進行維度建模可以保證
數(shù)據(jù)
粒度合理,模型靈活,能夠適應未來的信息資源,違反這些原則你將會把
用戶
弄糊涂,并且會遇到數(shù)據(jù)倉庫障礙。
原則1、載入詳細的原子數(shù)據(jù)到維度結構中
維度建模應該使用最
基礎
的原子數(shù)據(jù)進行填充,以支持不可預知的來自用戶
查詢
的過濾和分組請求,用戶通常不希望每次只看到一個單一的記錄,但是你無法預測用戶想要掩蓋哪些數(shù)據(jù),想要顯示哪些數(shù)據(jù),如果只有匯總數(shù)據(jù),那么你已經設定了數(shù)據(jù)的使用模式,當用戶想要深入挖掘數(shù)據(jù)時他們就會遇到障礙。當然,原子數(shù)據(jù)也可以通過概要維度建模進行補充,但企業(yè)用戶無法只在匯總數(shù)據(jù)上工作,他們需要原始數(shù)據(jù)回答不斷變化的問題。
原則2、圍繞
業(yè)務
流程構建維度模型
業(yè)務流程是組織執(zhí)行的活動,它們代表可測量的事件,如下一個
訂單
或做一次結算,業(yè)務流程通常會捕獲或生成唯一的與某個事件相關的
性能
指標,這些數(shù)據(jù)轉換成事實后,每個業(yè)務流程都用一個原子事實表表示,除了單個流程事實表外,有時會從多個流程事實表合并成一個事實表,而且合并事實表是對單一流程事實表的一個很好的補充,并不能代替它們。
原則3、確保每個事實表都有一個與之關聯(lián)的日期維度表
原則2中描述的可測量事件總有一個日期戳信息,每個事實表至少都有一個外鍵,關聯(lián)到一個日期維度表,它的粒度就是一天,使用日歷屬性和非標準的關于測量事件日期的特性,如財務月和公司假日指示符,有時一個事實表中有多個日期外鍵。
原則4、確保每個事實表中的事實具有相同的粒度或同級的詳細程度
在組織事實表時粒度上有三個基本原則:事務,周期快照或累加快照。無論粒度類型如何,事實表中的度量單位都必須達到相同水平的詳細程度,如果事實表中的事實表現(xiàn)的粒度不一樣,企業(yè)用戶會被搞暈,BI
應用
程序
會很脆弱,或者返回的結果根本就不對。
原則5、
解決
事實表中的多對多關系
由于事實表
存儲
的是業(yè)務流程事件的結果,因此在它們的外鍵之間存在多對多(M:M)的關系,如多個倉庫中的多個產品在多天銷售,這些外鍵字段不能為空,有時一個維度可以為單個測量事件賦予多個值,如一個保健對應多個診斷,或多個
客戶
有一個銀行賬號,在這些情況下,它的不合理直接解決了事實表中多值維度,這可能違反了測量事件的天然粒度,因此我們使用多對多,雙鍵橋接表連接事實表。
原則6、解決維度表中多對一的關系
屬性之間分層的、多對一(M:1)的關系通常未規(guī)范化,或者被收縮到扁平型維度表中,如果你曾經有過為事務型
系統(tǒng)
設計實體關系模型的經歷,那你一定要抵抗住舊有的思維模式,要將其規(guī)范化或將M:1關系拆分成更小的子維度,維度反向規(guī)范化是維度建模中常用的詞匯。
在單個維度表中多對一(M:1)的關系非常常見,一對一的關系,如一個產品描述對應一個產品
代碼
,也可以在維度表中處理,在事實表中偶爾也有多對一關系,如詳細當維度表中有上百萬條記錄時,它推出的屬性又經常發(fā)生變化。不管怎樣,在事實表中要慎用M:1關系。
原則7、存儲報告標記和過濾維度表中的范圍值
更重要的是,編碼和關聯(lián)的解碼及用于標記和查詢過濾的描述符應該被捕獲到維度表中,避免在事實表中存儲神秘的編碼字段或龐大的描述符字段,同樣,不要只在維度表中存儲編碼,假定用戶不需要描述性的解碼,或它們將在BI應用程序中得到解決。如果它是一個行/列標記或下拉菜單過濾器,那么它應該當作一個維度屬性處理。
盡管我們在原則5中已經陳述過,事實表外鍵不應該為空,同時在維度表的屬性字段中使用“NA”或另一個默認值替換空值來避免空值也是明智的,這樣可以減少用戶的困惑。
原則8、確定維度表使用了代理鍵
按順序分配代理鍵(除了日期維度)可以獲得一系列的操作優(yōu)勢,包括更小的事實表、索引以及性能改善,如果你正在跟蹤維度屬性的變化,為每個變化使用一個新的維度記錄,那么確實需要代理鍵,即使你的商業(yè)用戶沒有初始化跟蹤屬性改變的設想值,使用代理也會使下游策略變化更寬松,代理也允許你使用多個業(yè)務鍵映射到一個普通的配置
文件
,有利于你緩沖意想不到的業(yè)務活動,如廢棄產品編號的回收或收購另一家公司的編碼
方案
。
原則9、創(chuàng)建一致的維度集成整個企業(yè)的數(shù)據(jù)
對于企業(yè)數(shù)據(jù)倉庫一致的維度(也叫做通用維度、標準或參考維度)是最基本的原則,在ETL系統(tǒng)中
管理
一次,然后在所有事實表中都可以重用,一致的維度在整個維度模型中可以獲得一致的描述屬性,可以支持從多個業(yè)務流程中整合數(shù)據(jù),企業(yè)數(shù)據(jù)倉庫總線矩陣是最關鍵的架構藍圖,它展現(xiàn)了組織的核心業(yè)務流程和關聯(lián)的維度,重用一致的維度可以縮短產品的上市時間,也消除了冗余設計和
開發(fā)
過程,但一致的維度需要在數(shù)據(jù)管理和治理方面有較大的投入。
原則10、不斷平衡需求和現(xiàn)實,提供用戶可接受的并能夠支持他們決策的DW/BI解決方案
維度建模需要不斷在用戶需求和數(shù)據(jù)源事實之間進行平衡,才能夠提交可執(zhí)行性好的設計,更重要的是,要符合業(yè)務的需要,需求和事實之間的平衡是DW/BI從業(yè)人員必須面對的事實,無論是你集中在維度建模,還是
項目
策略、技術/ETL/BI架構或開發(fā)/維護規(guī)劃都要面對這一事實。
本站僅提供存儲服務,所有內容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權內容,請
點擊舉報
。
打開APP,閱讀全文并永久保存
查看更多類似文章
猜你喜歡
類似文章
數(shù)據(jù)建模方法及步驟
大數(shù)據(jù)數(shù)據(jù)倉庫建設方案
數(shù)據(jù)倉庫(二)之維度建模篇
萬字詳解數(shù)據(jù)倉庫建設體系方法
大話數(shù)倉,數(shù)據(jù)倉庫,維度建模方法(二)
數(shù)據(jù)平臺維度模型設計十個技巧
更多類似文章 >>
生活服務
首頁
萬象
文化
人生
生活
健康
教育
職場
理財
娛樂
藝術
上網(wǎng)
留言交流
回頂部
聯(lián)系我們
分享
收藏
點擊這里,查看已保存的文章
導長圖
關注
一鍵復制
下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!
聯(lián)系客服
微信登錄中...
請勿關閉此頁面
先別劃走!
送你5元優(yōu)惠券,購買VIP限時立減!
5
元
優(yōu)惠券
優(yōu)惠券還有
10:00
過期
馬上使用
×