快速創(chuàng)建,當(dāng)然是用庫(kù)啰。
主流的庫(kù):pandas、seaborn、matplotlib。
另外plotlib和bokeh也可以了解下。
pandas是基礎(chǔ),數(shù)據(jù)分析可視化,首先要分析,然后才談得上可視化。
(圖片來源:pandas官網(wǎng))
pandas的主要概念是DataFrame和Serie。其中用的最多的是DataFrame。DataFrame你可以簡(jiǎn)單理解為一張表格,每行是一個(gè)觀測(cè)(observation)/實(shí)例(instance),每列是一個(gè)特征(feature)/屬性(property)。理解了DataFrame,Serie也就不難理解,DataFrame的每行你都可以把它看成是一個(gè)Serie.
然后pandas提供了各種數(shù)據(jù)分析的方法,處理DataFrame和Serie.
然后,seaborn、matplotlib、plotly、bokeh都是繪圖庫(kù),用來繪制各種可視化的圖形。(當(dāng)然,其實(shí)pandas也可以用來繪圖,但是pandas的繪圖能力比較孱弱,一般不用。)
seaborn是基于matplotlib的,后出轉(zhuǎn)精,API用起來比matplotlib簡(jiǎn)潔舒服。不過seaborn并不能完全替代matplotlib,有的時(shí)候還是需要使用matplotlib。
(圖片來源:seaborn官網(wǎng))
seaborn和matplotlib都是繪制圖片,而plotly和bokeh可以做出可交互的圖片。當(dāng)然,這也就意味著,為了實(shí)現(xiàn)交互功能,你需要自己搭一個(gè)服務(wù)(bokeh),或者是找平臺(tái)host(plotly提供收費(fèi)host)。
聯(lián)系客服