“一個組織如果沒有認識到管理數(shù)據(jù)和信息如同管理有形資產(chǎn)一樣極其重要,那么它在新經(jīng)濟時代將無法生存”。在信息時代,數(shù)據(jù)被認為是一項重要的企業(yè)資產(chǎn),需要進行有效的管理并逐步提升其質(zhì)量,進而挖掘并發(fā)揮其價值,才能幫助企業(yè)領(lǐng)導者做出更準確的決策,保障企業(yè)的高效運轉(zhuǎn)。
銀行業(yè)是高度依賴數(shù)據(jù)進行決策的行業(yè),數(shù)據(jù)管理理論研究與實踐也走在了其它傳統(tǒng)行業(yè)的前列。中國光大銀行早在2008年就啟動全行數(shù)據(jù)標準化工作,并于2012年開展全面數(shù)據(jù)治理工作,發(fā)布數(shù)據(jù)政策,規(guī)劃數(shù)據(jù)體系,并制定數(shù)據(jù)體系建設(shè)任務(wù)藍圖,依照“以數(shù)據(jù)質(zhì)量為核心、數(shù)據(jù)標準為基礎(chǔ)、數(shù)據(jù)治理機制為支撐”的原則在全行范圍內(nèi)開展數(shù)據(jù)管理工作實踐。
在數(shù)據(jù)管理理論研究與實踐過程中發(fā)現(xiàn),數(shù)據(jù)管理的各個領(lǐng)域既相互獨立又互相依賴。數(shù)據(jù)管理的數(shù)據(jù)標準、元數(shù)據(jù)、主數(shù)據(jù)、數(shù)據(jù)質(zhì)量等領(lǐng)域,都可以自成體系且復雜、龐大;同時各領(lǐng)域互為依賴,各種管理流程緊密關(guān)聯(lián)。要全面、有序的在企業(yè)內(nèi)部推動數(shù)據(jù)管理,是一項長期、艱巨且難以見效的工作。在有限的人力資源及數(shù)據(jù)管理基礎(chǔ)下,達到推動數(shù)據(jù)管理工作實施、切實提升企業(yè)數(shù)據(jù)質(zhì)量的目的,必須確定數(shù)據(jù)管理的核心對象并實施相應的工作。
本文通過分析數(shù)據(jù)管理各領(lǐng)域管理內(nèi)容及相互關(guān)系,確定數(shù)據(jù)管理的核心對象,并闡述如何借助核心對象開展有效的一體化數(shù)據(jù)管理工作?;诤诵膶ο笾贫〝?shù)據(jù)管理的關(guān)鍵可行路徑,提升數(shù)據(jù)質(zhì)量并充分發(fā)揮數(shù)據(jù)管理價值。
一、數(shù)據(jù)管理的核心對象
在業(yè)務(wù)管理應用系統(tǒng)的實施過程中概念模型設(shè)計是一個非常重要的步驟,其方法是通過分析業(yè)務(wù)管理框架,抽象出實體以及實體之間的關(guān)系,即E-R圖,其中E就是業(yè)務(wù)管理的對象,R是業(yè)務(wù)管理對象之間的關(guān)系。例如,在貸款業(yè)務(wù)的概念模型設(shè)計中,抽象的業(yè)務(wù)實體主要有貸款客戶、合同(借據(jù))、賬戶、交易、抵質(zhì)押物等實體,所有的貸款業(yè)務(wù)流程及管理內(nèi)容均借助這些實體進行流轉(zhuǎn)與落實。
借助概念模型設(shè)計的原理,數(shù)據(jù)管理的核心對象是從數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)標準管理、元數(shù)據(jù)管理、數(shù)據(jù)架構(gòu)管理、數(shù)據(jù)安全管理等領(lǐng)域涉及的業(yè)務(wù)流程中抽象出來的一組核心實體。我們將描述數(shù)據(jù)載體的最小單元稱為數(shù)據(jù)元素,例如客戶身份證號碼即為一個數(shù)據(jù)元素。
圍繞核心對象,對數(shù)據(jù)管理各個領(lǐng)域進行說明。數(shù)據(jù)質(zhì)量管理是對各類的業(yè)務(wù)數(shù)據(jù)進行質(zhì)量監(jiān)測,持續(xù)發(fā)現(xiàn)數(shù)據(jù)質(zhì)量問題并整改,其管理的關(guān)鍵內(nèi)容對具體的數(shù)據(jù)元素指定的若干數(shù)據(jù)質(zhì)量檢核規(guī)則。數(shù)據(jù)標準管理的核心是對這些數(shù)據(jù)元素進行規(guī)范,在企業(yè)范圍內(nèi)實現(xiàn)業(yè)務(wù)與技術(shù)標準的統(tǒng)一。元數(shù)據(jù)管理的核心是定義并管理這些數(shù)據(jù)元素的業(yè)務(wù)描述、技術(shù)屬性以及業(yè)務(wù)數(shù)據(jù)口徑、加工路徑等內(nèi)容,促進及時、準確的了解數(shù)據(jù)含義及血緣關(guān)系。數(shù)據(jù)模型與架構(gòu)管理則是將這些數(shù)據(jù)元素進行組合形成一個個業(yè)務(wù)實體,并明確這些業(yè)務(wù)實體的關(guān)系,同時確定這些業(yè)務(wù)實體在應用系統(tǒng)中的分布,從而有效支撐企業(yè)的業(yè)務(wù)運轉(zhuǎn)。數(shù)據(jù)安全管理是明確這些數(shù)據(jù)元素的安全等級,并對相應的業(yè)務(wù)數(shù)據(jù)采取必要的安全措施。
從業(yè)務(wù)數(shù)據(jù)的角度看,可分為基礎(chǔ)類數(shù)據(jù)與分析類數(shù)據(jù)?;A(chǔ)類數(shù)據(jù)是業(yè)務(wù)經(jīng)營活動中產(chǎn)生的數(shù)據(jù),根據(jù)行業(yè)經(jīng)驗和FS-LDM方法指導,可劃分為客戶、產(chǎn)品、客戶資產(chǎn)、員工與機構(gòu)、賬戶、營銷活動、交易、渠道、財務(wù)和地理位置等數(shù)據(jù)主題,這些數(shù)據(jù)既彼此獨立,又發(fā)生各種關(guān)聯(lián)。分析類數(shù)據(jù)則是對基礎(chǔ)數(shù)據(jù)進行加工匯總后用于經(jīng)營分析決策的數(shù)據(jù),指標與報表是分析類數(shù)據(jù)中兩種典型類型?;跇I(yè)務(wù)數(shù)據(jù)的分類,用于描述業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)元素表現(xiàn)為三種形式:一是基礎(chǔ)類,描述信息項及相關(guān)的技術(shù)與業(yè)務(wù)屬性;二是指標類,描述指標名稱、約束條件、度量、維度、業(yè)務(wù)口徑等內(nèi)容;三是報表類,描述報表的行、列、顯示內(nèi)容以及各個單元格的取數(shù)口徑等內(nèi)容。
根據(jù)以上分析,業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)元素就是對數(shù)據(jù)管理各領(lǐng)域中所管理的核心數(shù)據(jù)元素進行抽象,進而形成數(shù)據(jù)管理的核心對象。為更明確的表達核心管理對象的含義,我們在這里分別稱為為基礎(chǔ)數(shù)據(jù)元、指標數(shù)據(jù)元及報表數(shù)據(jù)元。核心管理對象之間的關(guān)系,以及與數(shù)據(jù)管理各領(lǐng)域的關(guān)系如下圖所示:
(注1:伴隨業(yè)務(wù)需求的復雜和數(shù)據(jù)體系的發(fā)展,數(shù)據(jù)應用層次將逐步從描述階段過渡到挖掘階段。報表數(shù)據(jù)元重點對應描述階段的數(shù)據(jù)應用,在挖掘階段還會包括分析模型、挖掘模型等管理數(shù)據(jù)元。無論如何,整體數(shù)據(jù)管理模式類似,因此不再進行額外說明。)
二、核心對象與數(shù)據(jù)體系
基礎(chǔ)數(shù)據(jù)元、指標數(shù)據(jù)元與報表數(shù)據(jù)元是數(shù)據(jù)管理活動的核心實體,借助核心實體的屬性及實體之間的關(guān)系,可以幫助我們清晰的描述數(shù)據(jù)管理各領(lǐng)域活動以及跨領(lǐng)域之間的關(guān)聯(lián)關(guān)系,打通數(shù)據(jù)管理各個環(huán)節(jié)并使之成為“有機、整體的”數(shù)據(jù)管理流程。下文將逐一列舉重點流程,闡述如何通過核心對象打通各領(lǐng)域之間的關(guān)系以支撐數(shù)據(jù)管理工作。
元數(shù)據(jù)管理:(1)這三類數(shù)據(jù)元實體內(nèi)的內(nèi)容均為對業(yè)務(wù)數(shù)據(jù)的屬性描述,是元數(shù)據(jù)管理的核心內(nèi)容。(2)構(gòu)建的報表數(shù)據(jù)元、指標數(shù)據(jù)元、基礎(chǔ)數(shù)據(jù)元之間的關(guān)系數(shù)據(jù),是血緣分析和影響性分析的重要基礎(chǔ)。(3)通過基礎(chǔ)元數(shù)據(jù)與數(shù)據(jù)字典之間的關(guān)系,數(shù)據(jù)管理各領(lǐng)域工作連接起來并深入到具體業(yè)務(wù)和系統(tǒng)中。
數(shù)據(jù)質(zhì)量管理:(1)針對基礎(chǔ)數(shù)據(jù)元設(shè)定檢核規(guī)則,借助基礎(chǔ)數(shù)據(jù)元與數(shù)據(jù)字典的關(guān)聯(lián)關(guān)系,可以對所有應用系統(tǒng)中的同一信息項進行監(jiān)測。如對“客戶名稱”設(shè)定合法性檢查規(guī)則后,可對所有有“客戶名稱”這一字段的系統(tǒng)及相應表內(nèi)數(shù)據(jù)進行檢查。 (2)針對指標數(shù)據(jù)元設(shè)定檢核規(guī)則,并通過指標數(shù)據(jù)元與基礎(chǔ)數(shù)據(jù)元的血緣關(guān)系來確定影響指標數(shù)據(jù)質(zhì)量的基礎(chǔ)數(shù)據(jù)元,并可找到對應的系統(tǒng)、表及字段。例如檢測發(fā)現(xiàn)兩個指標數(shù)據(jù)不一致時,可通過分析指標的加工口徑、數(shù)據(jù)來源等找到不一致原因。(3)數(shù)據(jù)質(zhì)量問題整改時,可通過具體數(shù)據(jù)元信息,找到與問題數(shù)據(jù)有關(guān)的業(yè)務(wù)系統(tǒng)、業(yè)務(wù)品種,并關(guān)聯(lián)到相關(guān)責任部門,從而開展分析、整改、監(jiān)測工作。
具體的數(shù)據(jù)質(zhì)量改進與監(jiān)控流程如下:
圖2:數(shù)據(jù)質(zhì)量改進與監(jiān)控流程
數(shù)據(jù)標準管理:(1)通過基礎(chǔ)數(shù)據(jù)元與標準定義關(guān)聯(lián),可自動生成檢核規(guī)則,檢查各系統(tǒng)對數(shù)據(jù)標準落地執(zhí)行的情況,例如可根據(jù)數(shù)據(jù)標準中的證件類型代碼生成證件類型有效檢核規(guī)則。(2)定期對指標數(shù)據(jù)元進行重檢,對口徑相同或相似的指標數(shù)據(jù)元進行標準化定義,以便在全行范圍統(tǒng)一業(yè)務(wù)口徑及技術(shù)口徑,保證數(shù)據(jù)一致性。
數(shù)據(jù)架構(gòu)與模型管理:(1)利用基礎(chǔ)數(shù)據(jù)元與數(shù)據(jù)字典的映射關(guān)系直接生成數(shù)據(jù)分布現(xiàn)狀,并可看出存在的同一數(shù)據(jù)多頭存儲、同一字段在不同系統(tǒng)定義不一致等對數(shù)據(jù)共享、數(shù)據(jù)整合有影響的各類問題。如客戶規(guī)模存在多個系統(tǒng),但業(yè)務(wù)定義、長度等均不一致。(2)通過不斷完善各類數(shù)據(jù)元中的具體信息項,并對其合理分類以及構(gòu)建各類之間的關(guān)系,可幫助快速建立企業(yè)級的數(shù)據(jù)模型,并對數(shù)據(jù)架構(gòu)管理提供支持。
數(shù)據(jù)安全管理:(1)通過對基礎(chǔ)數(shù)據(jù)元和指標數(shù)據(jù)元的安全分級與分類,并明確相應的數(shù)據(jù)安全處理要求。(2)通過數(shù)據(jù)字典與基礎(chǔ)數(shù)據(jù)元映射關(guān)系實現(xiàn)數(shù)據(jù)安全要求在應用系統(tǒng)的落實。(3)通過指標數(shù)據(jù)元與報表數(shù)據(jù)元的關(guān)系,可落實報表數(shù)據(jù)的安全要求。
三、結(jié)束語
綜合基礎(chǔ)數(shù)據(jù)元、指標數(shù)據(jù)元、報表數(shù)據(jù)元這三個數(shù)據(jù)實體及其之間的關(guān)系,構(gòu)成數(shù)據(jù)管理的E-R圖并作為數(shù)據(jù)管理的核心對象,對數(shù)據(jù)管理各領(lǐng)域業(yè)務(wù)流程發(fā)揮核心的支撐作用。
通過分析數(shù)據(jù)管理核心對象及其關(guān)系描述,將數(shù)據(jù)數(shù)據(jù)管理各領(lǐng)域進行有機連接,最終建立全面、完整的一體化數(shù)據(jù)管理機制與流程。同時,以核心對象為管理目標,配套建立靈活、功能強大的數(shù)據(jù)管理平臺,使數(shù)據(jù)管理工作迅速走向自動化和精細化,為實現(xiàn)數(shù)據(jù)管理的量化管理奠定堅實基礎(chǔ)。
作者劉巍,中國光大銀行信息科技部,多年數(shù)據(jù)治理與管理經(jīng)驗。