我們做數(shù)據(jù)分析的有句話叫“一圖勝千言”,圖表是展現(xiàn)數(shù)據(jù)的一種重要展現(xiàn)形式,選對(duì)了圖表就能幫助我們更加快速、直觀的傳達(dá)數(shù)據(jù)信息。
但是圖表的種類繁多,應(yīng)用場(chǎng)景不一,所以很多新手在進(jìn)行數(shù)據(jù)可視化時(shí),經(jīng)常不知道什么樣的圖表來展示自己的數(shù)據(jù)才是最合適的,今天就給大家分享圖表選擇的正確流程和方法,幫助大家選擇正確圖表
講方法之前,我們先了解一下什么才是好的圖表
好的圖表應(yīng)該應(yīng)該滿足“四個(gè)好”:好懂、好看、好做、好用
不管我們用哪種類型的圖表,都需要牢記以下三條原則:
下面說正題,我們應(yīng)該如何選擇有效的圖表,我畫了一個(gè)圖表制作流程圖:
首先獲取數(shù)據(jù),確定數(shù)據(jù)展現(xiàn)的主題,也就是你想利用圖表從數(shù)據(jù)中獲得哪些信息,然后根據(jù)數(shù)據(jù)之間的對(duì)比關(guān)系選擇圖表類型。這個(gè)過程你還可能通過圖表分析出新的問題,或者嘗試從多個(gè)維度分析數(shù)據(jù)。
1、確定表達(dá)主題
同一組數(shù)據(jù)用不同的角度看,有不同的主題,比如下面這組數(shù)據(jù):
如果你的注意力放在 1 月- 5 月的銷售發(fā)展趨勢(shì)以及售價(jià)是怎么樣隨時(shí)間而變化的。那你的圖表主題應(yīng)該是「銷售額自 1 月份開始穩(wěn)步上升」
或者你可能想把重點(diǎn)集中在某一點(diǎn)上,比如說集中在 5 月份的數(shù)據(jù)上,你可能會(huì)記錄產(chǎn)品 A,B 和 C 的銷售量排列名次。那樣的話,圖表主題應(yīng)該是「5 月份,產(chǎn)品A的銷售額大幅超過B和C」
從另一個(gè)角度看同樣是5月份的數(shù)據(jù),你還可能會(huì)將側(cè)重點(diǎn)放在每個(gè)產(chǎn)品占銷售額的百分比上。那你的圖表主題應(yīng)該是「5月份,產(chǎn)品 A 占公司產(chǎn)品總銷售額的比例位居首位」。
選擇合適圖表的關(guān)鍵,最初也是最重要的,就是確定想要表達(dá)的具體主題。而選擇正確的圖表形式,完全取決于主題是否清晰明確。圖表僅僅是表明數(shù)據(jù)的組織形式,它最終是要強(qiáng)調(diào)一個(gè)主題,這主題其實(shí)就可以作為圖表的標(biāo)題。
2、確定對(duì)比關(guān)系
給大家簡(jiǎn)單舉幾個(gè)例子:
“預(yù)計(jì)在今后 10 年多的時(shí)間里,銷售額將增長(zhǎng) ”對(duì)應(yīng)的關(guān)系為時(shí)間趨勢(shì)
“雇員的最高工資額在 30000 到 35000 美元之間 ”對(duì)應(yīng)的關(guān)系為頻率分布
“汽油并不是牌子越響價(jià)格越高其性能就越好”對(duì)應(yīng)的關(guān)系為相關(guān)性
“9 月份里,6 個(gè)區(qū)域的營(yíng)業(yè)額大致相同”對(duì)應(yīng)的關(guān)系為排名對(duì)比
“銷售部經(jīng)理在他的領(lǐng)域內(nèi)只花費(fèi)了他 15% 的時(shí)間”對(duì)應(yīng)的關(guān)系為占比
“獎(jiǎng)金的多少與工齡長(zhǎng)短無關(guān)“對(duì)應(yīng)的關(guān)系為相關(guān)性
“去年,人員更替主要發(fā)生在 30-35 歲的年齡段”對(duì)應(yīng)的關(guān)系為頻率分布
“C 區(qū)域的產(chǎn)品生產(chǎn)力排名墊底”對(duì)應(yīng)的關(guān)系為排名對(duì)比
“我們公司的平均收入份額正在下降”對(duì)應(yīng)的關(guān)系為時(shí)間趨勢(shì)
“制造業(yè)占有資金的最大份額”對(duì)應(yīng)的關(guān)系為占比
3、選擇圖表形式
現(xiàn)在我們準(zhǔn)備好了進(jìn)入最后一個(gè)步驟:從相對(duì)關(guān)系到最適合你的信息的圖表形式
數(shù)據(jù)可視化的圖表各式各樣、種類繁多,但只要掌握其中的一小部分就能滿足絕大多數(shù)需求。其中最常用的只有十幾種類型
1、占比
在成分對(duì)比關(guān)系中,我們主要對(duì)每一部分的大小占總數(shù)的百分比感興趣,比如:
你的主題中只要包括如下詞匯如:份額、占比、總數(shù)百分比、占百分比多少等字樣時(shí),可以肯定你是在制作一個(gè)構(gòu)成的對(duì)比關(guān)系圖表。
構(gòu)成對(duì)比關(guān)系的常用圖表有如下幾個(gè):
餅圖:餅圖是一個(gè)劃分為幾個(gè)扇形的圓形統(tǒng)計(jì)圖表,通常用來展現(xiàn)數(shù)據(jù)的分類和占比情況。比如想要突出表示某個(gè)部分在整體中所占比例,尤其該部分所占比例達(dá)到總體的25%或50%時(shí)。
環(huán)形圖:展現(xiàn)數(shù)據(jù)的分類和占比情況,相比餅圖,環(huán)形圖的可讀性更高,可以把重要數(shù)據(jù)放在中間
百分比堆積條形圖:對(duì)比同一個(gè)分組數(shù)據(jù)內(nèi)不同分類的占比,分組多
百分比堆積柱形圖:對(duì)比同一個(gè)分組數(shù)據(jù)內(nèi)不同分類的占比,分組少
矩形樹狀圖:清晰地顯示層次結(jié)構(gòu),通過矩形面積、排列的不同來展示層次內(nèi)部的占比關(guān)系
2、項(xiàng)目對(duì)比關(guān)系(比較)
在項(xiàng)目對(duì)比時(shí),我們需要比較類別間的大小、高低,例如:
我們可以從大于、小于或相同之類的詞匯中找到類別比較的線索
常用的圖表類型如下:
柱形圖
條形圖
堆積條形圖:表示多個(gè)類別里的各構(gòu)成的對(duì)比,表明組成整體的成分情況
旋風(fēng)圖:對(duì)比分類數(shù)據(jù)的數(shù)值大小,表明兩個(gè)不同成分的特點(diǎn),如進(jìn)口百分比與出口百分比
范圍條形圖:表示多個(gè)類別間的由低到高的數(shù)值范圍,而不是表示單個(gè)數(shù)值,適合用于表示多個(gè)類別間的數(shù)值范圍間的比較。
詞云:展現(xiàn)文本信息,對(duì)出現(xiàn)頻率較高的“關(guān)鍵詞”予以視覺上的突出
雷達(dá)圖:將多個(gè)分類的數(shù)據(jù)量映射到坐標(biāo)軸上,對(duì)比某項(xiàng)目不同屬性的特點(diǎn)。了解同類別的不同屬性的綜合情況,以及比較不同類別的相同屬性差異。
3、時(shí)間序列對(duì)比關(guān)系
這個(gè)對(duì)比關(guān)系是我們最常見的對(duì)比關(guān)系,表示隨時(shí)間變化的情況。
我們對(duì)每一個(gè)部分在總數(shù)的比例或大小不感興趣,但是對(duì)它們隨時(shí)間的變化感興趣,比如:
時(shí)間序列對(duì)比關(guān)系的觸發(fā)詞有:變化、增長(zhǎng)、下降、減少、波動(dòng)等。
常見的圖表類型如下:
折線圖:展示連續(xù)數(shù)值(例如時(shí)間)或者有序分類的變化趨勢(shì)
面積圖:用面積展示數(shù)值大小。展示數(shù)量隨時(shí)間變化的趨勢(shì)。
垂直瀑布圖:一般適用于匯報(bào)數(shù)量的增減,比如一年中各月銷售額、用戶數(shù)等指標(biāo)的變化
4、頻率分布對(duì)比關(guān)系
這種對(duì)比關(guān)系表示有多少個(gè)項(xiàng)目或類別符合一個(gè)數(shù)字發(fā)展的范圍。
比如,我們用一個(gè)頻率分布對(duì)比關(guān)系來展示我司有多少員工的月薪超過5萬元,有多少員工的月薪處于3-5萬元之間,有多少員工的月薪在1-3萬元區(qū)間等,或者有多少員工的年齡小于25歲,25-30歲員工人數(shù)有多少、超過30歲的員工人數(shù)有多少等。
這種對(duì)比關(guān)系的關(guān)鍵詞包括:x到y(tǒng)的范圍,密度,頻率,分布等。
常用圖表類型如下:
人口金字塔圖(和上面的旋風(fēng)圖類似)
直方圖:表達(dá)連續(xù)的區(qū)間上數(shù)量的分布
分布曲線圖
箱型圖
5、相關(guān)性對(duì)比關(guān)系
相關(guān)性對(duì)比關(guān)系表示兩個(gè)變數(shù)之間的關(guān)系可以是,也可以不是你所證明的模式。例如:你可以證明利潤(rùn)隨著銷售額的增加而增長(zhǎng),也可以論證銷售額隨著打折幅度的增加而增長(zhǎng)
當(dāng)你的主題包括與什么相關(guān),隨什么增長(zhǎng),隨什么減退,根據(jù)什么變化,或者不隨什么增長(zhǎng)等,那么就可以斷定是一個(gè)相關(guān)性對(duì)比關(guān)系。
相關(guān)性對(duì)比關(guān)系因?yàn)槭潜硎緝蓚€(gè)變量——之間的關(guān)系,兩個(gè)坐標(biāo)軸都是數(shù)值軸,和常見的其它圖表類型柱形圖、條形圖、折線圖等一個(gè)類別軸(或時(shí)間軸)、一個(gè)數(shù)值軸不同。
下面是表達(dá)相關(guān)性的常用圖表類型:
散點(diǎn)圖:散點(diǎn)圖通常用于顯示和比較數(shù)值,不光可以顯示趨勢(shì),還能顯示數(shù)據(jù)集群的形狀,以及在數(shù)據(jù)云團(tuán)中各數(shù)據(jù)點(diǎn)的關(guān)系。
波士頓矩陣圖
氣泡圖
6、以位置分布關(guān)系進(jìn)行類別對(duì)比
空間圖表可以數(shù)據(jù)中的精確位置和地理模式。比如顯示人流量最多的航站樓或全國(guó)各地所有銷售額
空間地圖包括填充地圖、點(diǎn)分布圖、符號(hào)地圖和密度地圖,常用的類型如下:
區(qū)域地圖:區(qū)域圖是對(duì)不同的區(qū)域劃分分別進(jìn)行區(qū)面著色展示的可視化類型
點(diǎn)地圖:點(diǎn)地圖圖是把一系列離散的數(shù)據(jù)點(diǎn)按照位置信息標(biāo)注在地圖上。適合需要把大量具有相同屬性的地址信息同時(shí)展示在地圖上的業(yè)務(wù)場(chǎng)景。比如展示連鎖店分布、加油站分布、銀行網(wǎng)點(diǎn)分布等。
熱力地圖:熱力圖通過指定的半徑范圍進(jìn)行數(shù)據(jù)疊加計(jì)算,然后與梯度顏色進(jìn)行數(shù)據(jù)映射,不同的顏色深度代表不同的數(shù)據(jù)密度。通常適用于數(shù)據(jù)量比較多且在一定地域范圍內(nèi)相對(duì)密集的業(yè)務(wù)場(chǎng)景。
比如展示某個(gè)商圈的人流分布、某個(gè)景區(qū)的客流分布、某個(gè)區(qū)域的車流分布等。
流向地圖:遷徙圖是在兩點(diǎn)之間繪制弧線進(jìn)行連接,并配以動(dòng)畫呈現(xiàn)移動(dòng)效果的圖像,主要用于展示不同地點(diǎn)之間人員、物品、車輛等流動(dòng)的方向。
聯(lián)系客服