国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
維度建模的10大基本原則

 

【IT168技術分析】
  遵循這些原則進行維度建模可以保證數(shù)據(jù)粒度合理,模型靈活,能夠適應未來的信息資源,違反這些原則你將會把用戶弄糊涂,并且會遇到數(shù)據(jù)倉庫障礙。
  原則1、載入詳細的原子數(shù)據(jù)到維度結構中
  維度建模應該使用最基礎的原子數(shù)據(jù)進行填充,以支持不可預知的來自用戶查詢的過濾和分組請求,用戶通常不希望每次只看到一個單一的記錄,但是你無法預測用戶想要掩蓋哪些數(shù)據(jù),想要顯示哪些數(shù)據(jù),如果只有匯總數(shù)據(jù),那么你已經設定了數(shù)據(jù)的使用模式,當用戶想要深入挖掘數(shù)據(jù)時他們就會遇到障礙。當然,原子數(shù)據(jù)也可以通過概要維度建模進行補充,但企業(yè)用戶無法只在匯總數(shù)據(jù)上工作,他們需要原始數(shù)據(jù)回答不斷變化的問題。
  原則2、圍繞業(yè)務流程構建維度模型
  業(yè)務流程是組織執(zhí)行的活動,它們代表可測量的事件,如下一個訂單或做一次結算,業(yè)務流程通常會捕獲或生成唯一的與某個事件相關的性能指標,這些數(shù)據(jù)轉換成事實后,每個業(yè)務流程都用一個原子事實表表示,除了單個流程事實表外,有時會從多個流程事實表合并成一個事實表,而且合并事實表是對單一流程事實表的一個很好的補充,并不能代替它們。
  原則3、確保每個事實表都有一個與之關聯(lián)的日期維度表
  原則2中描述的可測量事件總有一個日期戳信息,每個事實表至少都有一個外鍵,關聯(lián)到一個日期維度表,它的粒度就是一天,使用日歷屬性和非標準的關于測量事件日期的特性,如財務月和公司假日指示符,有時一個事實表中有多個日期外鍵。
  原則4、確保每個事實表中的事實具有相同的粒度或同級的詳細程度
  在組織事實表時粒度上有三個基本原則:事務,周期快照或累加快照。無論粒度類型如何,事實表中的度量單位都必須達到相同水平的詳細程度,如果事實表中的事實表現(xiàn)的粒度不一樣,企業(yè)用戶會被搞暈,BI應用程序會很脆弱,或者返回的結果根本就不對。
  原則5、解決事實表中的多對多關系
  由于事實表存儲的是業(yè)務流程事件的結果,因此在它們的外鍵之間存在多對多(M:M)的關系,如多個倉庫中的多個產品在多天銷售,這些外鍵字段不能為空,有時一個維度可以為單個測量事件賦予多個值,如一個保健對應多個診斷,或多個客戶有一個銀行賬號,在這些情況下,它的不合理直接解決了事實表中多值維度,這可能違反了測量事件的天然粒度,因此我們使用多對多,雙鍵橋接表連接事實表。
  原則6、解決維度表中多對一的關系
  屬性之間分層的、多對一(M:1)的關系通常未規(guī)范化,或者被收縮到扁平型維度表中,如果你曾經有過為事務型系統(tǒng)設計實體關系模型的經歷,那你一定要抵抗住舊有的思維模式,要將其規(guī)范化或將M:1關系拆分成更小的子維度,維度反向規(guī)范化是維度建模中常用的詞匯。
  在單個維度表中多對一(M:1)的關系非常常見,一對一的關系,如一個產品描述對應一個產品代碼,也可以在維度表中處理,在事實表中偶爾也有多對一關系,如詳細當維度表中有上百萬條記錄時,它推出的屬性又經常發(fā)生變化。不管怎樣,在事實表中要慎用M:1關系。
  原則7、存儲報告標記和過濾維度表中的范圍值
  更重要的是,編碼和關聯(lián)的解碼及用于標記和查詢過濾的描述符應該被捕獲到維度表中,避免在事實表中存儲神秘的編碼字段或龐大的描述符字段,同樣,不要只在維度表中存儲編碼,假定用戶不需要描述性的解碼,或它們將在BI應用程序中得到解決。如果它是一個行/列標記或下拉菜單過濾器,那么它應該當作一個維度屬性處理。
  盡管我們在原則5中已經陳述過,事實表外鍵不應該為空,同時在維度表的屬性字段中使用“NA”或另一個默認值替換空值來避免空值也是明智的,這樣可以減少用戶的困惑。
  原則8、確定維度表使用了代理鍵
  按順序分配代理鍵(除了日期維度)可以獲得一系列的操作優(yōu)勢,包括更小的事實表、索引以及性能改善,如果你正在跟蹤維度屬性的變化,為每個變化使用一個新的維度記錄,那么確實需要代理鍵,即使你的商業(yè)用戶沒有初始化跟蹤屬性改變的設想值,使用代理也會使下游策略變化更寬松,代理也允許你使用多個業(yè)務鍵映射到一個普通的配置文件,有利于你緩沖意想不到的業(yè)務活動,如廢棄產品編號的回收或收購另一家公司的編碼方案
  原則9、創(chuàng)建一致的維度集成整個企業(yè)的數(shù)據(jù)
  對于企業(yè)數(shù)據(jù)倉庫一致的維度(也叫做通用維度、標準或參考維度)是最基本的原則,在ETL系統(tǒng)中管理一次,然后在所有事實表中都可以重用,一致的維度在整個維度模型中可以獲得一致的描述屬性,可以支持從多個業(yè)務流程中整合數(shù)據(jù),企業(yè)數(shù)據(jù)倉庫總線矩陣是最關鍵的架構藍圖,它展現(xiàn)了組織的核心業(yè)務流程和關聯(lián)的維度,重用一致的維度可以縮短產品的上市時間,也消除了冗余設計和開發(fā)過程,但一致的維度需要在數(shù)據(jù)管理和治理方面有較大的投入。
  原則10、不斷平衡需求和現(xiàn)實,提供用戶可接受的并能夠支持他們決策的DW/BI解決方案
  維度建模需要不斷在用戶需求和數(shù)據(jù)源事實之間進行平衡,才能夠提交可執(zhí)行性好的設計,更重要的是,要符合業(yè)務的需要,需求和事實之間的平衡是DW/BI從業(yè)人員必須面對的事實,無論是你集中在維度建模,還是項目策略、技術/ETL/BI架構或開發(fā)/維護規(guī)劃都要面對這一事實。
本站僅提供存儲服務,所有內容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權內容,請點擊舉報。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
數(shù)據(jù)建模方法及步驟
大數(shù)據(jù)數(shù)據(jù)倉庫建設方案
數(shù)據(jù)倉庫(二)之維度建模篇
萬字詳解數(shù)據(jù)倉庫建設體系方法
大話數(shù)倉,數(shù)據(jù)倉庫,維度建模方法(二)
數(shù)據(jù)平臺維度模型設計十個技巧
更多類似文章 >>
生活服務
分享 收藏 導長圖 關注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服