University Of Maryland的Shneiderman教授把數(shù)據(jù)分析的過程歸納為三大步:Overview,Zoom&Filter,Detail-on-demand??梢源笾潞喿g為:全盤觀察,深入及過濾,及時獲取詳細(xì)數(shù)據(jù)。這三步可以說缺一不可。不僅是數(shù)據(jù)分析的一個主要的流程,也是數(shù)據(jù)分析軟件所必須提供了功能。我們在這里來簡單看一看每一步的工作和需要的工具支持。
全盤觀察
對數(shù)據(jù)的一個全盤觀察是每一個數(shù)據(jù)分析的起始點。除非你已經(jīng)有一個明確的分析重點,一個全面的數(shù)據(jù)呈現(xiàn)界面可以讓你很快地判斷出你是否需要進(jìn)一步的分析,或者進(jìn)一步分析的方向。但很多BI軟件往往忽約了這一點。
在設(shè)計一個分析界面時,如果我們要求用戶做很多工作才能看到一個全面的情況,用戶就失去了一個很快掌握全局的機(jī)會。比如下面的一個Dashboard。
通過對這個界面的初步分析,我們知道數(shù)據(jù)被按照地區(qū)(Location)分成了不同的視圖。如果一個用戶需要找到感興趣的地區(qū),他就需要一個一個地區(qū)的去點擊。這不僅被迫用戶做出不必要的操作,而且完全打斷了用戶的思路。如果用戶需要對不同地區(qū)進(jìn)行比較,等到點擊到幾個地區(qū)之后,大概也已經(jīng)忘記最初始的情況了。
提供一個全局的展現(xiàn),當(dāng)然也不是只是一個理念就能解決的問題。如果我們想把大量的數(shù)據(jù)集成在一個界面,不需任何切換就可以觀察,就需要相應(yīng)的軟件支持。比如子彈圖,Sparkline等等工具。在這里就不詳細(xì)描述了。
深入及過濾
一旦用戶找到了感興趣的方面,第二步的工作就需要縮小范圍,更進(jìn)一步分析相關(guān)的數(shù)據(jù)。從實現(xiàn)的角度,這里有兩種可能。第一,如果可能的話,用戶可以直接在全盤的界面上做一些放大和過濾的工作。但因為空間的限制,往往一個全局的界面已經(jīng)比較擁擠,同時包含一些詳盡分析功能有一些困難。
如果是這種情況,我們可以提供一個快捷的切換功能,讓用戶可以在保持當(dāng)前環(huán)境(Context)的情況下,迅速地切換的新的界面。在這個步驟里,用戶需要很強(qiáng)大的功能從不同的角度,不同的層次對數(shù)據(jù)進(jìn)行顯示和操作。這些操作主要包括數(shù)據(jù)過濾,圖表切換,數(shù)字比較及再計算等等。
數(shù)據(jù)過濾的目的是靈活地縮小數(shù)據(jù)的范圍。根據(jù)不同的數(shù)據(jù)種類,我們可以選擇合適的工具,比如可選列表,可拉動滾動條等。
作為數(shù)據(jù)的重要顯示渠道,圖表本身也應(yīng)該提供大量的數(shù)據(jù)過濾與操作功能。比如用戶應(yīng)該可以快捷地轉(zhuǎn)換數(shù)據(jù)顯示形式,進(jìn)行不同的排序,計算,和比較。這些可以通過一些預(yù)先設(shè)計的界面,讓用戶用最簡單的形式和數(shù)據(jù)互動。或者通過一個完全開放的界面,讓用戶任意地定義圖表的展示。
以下是StyleScope的終端用戶界面。
分析的目的,是找到有用的信息,從而采取相應(yīng)的措施。而最后的決定,往往還是需要落實到具體的事件。所以從分析的綜合數(shù)據(jù)到低層的細(xì)節(jié)數(shù)據(jù)是至關(guān)重要的一步。這個問題貌似簡單,但卻是很多分析軟件的一個軟肋。
最傳統(tǒng)的分析方案,OLAP,通過提前計算匯總數(shù)據(jù)來達(dá)到更高的速度。但這樣的直接后果是匯總數(shù)據(jù)和詳細(xì)數(shù)據(jù)的關(guān)系就常常失去了。雖然新的OLAP系統(tǒng)通常會提供一個解決方案,但往往結(jié)果并不是最優(yōu)化。
另一個需要解決的問題是用戶怎樣選擇需要的詳細(xì)數(shù)據(jù)。一個常用的方法是直接在圖表上通過選擇數(shù)據(jù)點,然后直接鏈接到詳細(xì)數(shù)據(jù)上。