重磅干貨,第一時間送達(dá)
信息可視化是數(shù)據(jù)分析中一個重要的部分。它也可能是探索數(shù)據(jù)的一部分,比如,幫助我們找到離群點或需要進(jìn)行變換的數(shù)據(jù),或幫助我們思考選擇哪種模型更合適。Python有很多庫能用來制作統(tǒng)計或動態(tài)可視化,但這里我們重點關(guān)注matplotlib pandas searborn等庫。Matplotlib是一個非常強(qiáng)大的畫圖工具,對數(shù)據(jù)的可視化起著很大的作用。Maplotlib可以畫圖線圖,散點圖,等高線圖,條形圖,柱形圖,3D圖形,圖形動畫等。
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
x=np.linspace(-1,1,50) #定義x
y1=2*x+1 #定義y數(shù)據(jù)范圍
y2=x**2
plt.figure() #定義圖像窗口
plt.plot(x,y1) #畫出曲線
plt.plot(x,y2)
plt.show() #顯示圖像
x=np.linspace(-3,3,50) #在(-3,3)之間生成50個樣本數(shù)
y1=2*x+1
y2=x**2
plt.figure(num=1,figsize=(8,5)) #定義編號為1,大小為(8,5)
plt.plot(x,y1,color='red',linewidth=2,linestyle='--') #顏色線寬及格式
plt.plot(x,y2)
plt.show()
x=np.linspace(-3,3,50) #在(-3,3)之間生成50個樣本數(shù)
y1=2*x+1
y2=x**2
plt.figure(num=1,figsize=(8,5)) #定義編號為1,大小為(8,5)
plt.plot(x,y1,color='red',linewidth=2,linestyle='--')
plt.plot(x,y2)
plt.xlim(-1,2) #x軸的范圍
plt.ylim(-2,3) #y軸的范圍
plt.xlabel('x軸')
plt.ylabel('y軸')
plt.show()
x=np.linspace(-3,3,50) #在(-3,3)之間生成50個樣本數(shù)
y1=2*x+1
y2=x**2
plt.figure(num=2,figsize=(8,5)) #定義編號為2,大小為(8,5)
plt.plot(x,y1,color='red',linewidth=2,linestyle='--')
plt.plot(x,y2)
plt.xlim(-1,2) #x軸的范圍
plt.ylim(-2,3) #y軸的范圍
plt.xlabel('x軸')
plt.ylabel('y軸')
new_ticks=np.linspace(-1,2,5) #-1到2分成5段,包含端點
print(new_ticks)
plt.xticks(new_ticks) #進(jìn)行替換新下標(biāo)
plt.yticks([-2,-1,0,1,2,],
[r'$really\ bad$','$bad$','$0$','$well$','$really\ well$'])
plt.show()
[-1. -0.25 0.5 1.25 2. ]
x=np.linspace(-3,3,50) #在(-3,3)之間生成50個樣本數(shù)
y1=2*x+1
y2=x**2
plt.figure(num=2,figsize=(8,5)) #定義編號為2,大小為(8,5)
plt.plot(x,y1,color='red',linewidth=2,linestyle='--')
plt.plot(x,y2)
plt.xlim(-1,2) #x軸的范圍
plt.ylim(-2,3) #y軸的范圍
plt.xlabel('x軸')
plt.ylabel('y軸')
new_ticks=np.linspace(-1,2,5) #-1到2分成5段,包含端點
print(new_ticks)
plt.xticks(new_ticks) #進(jìn)行替換新下標(biāo)
plt.yticks([-2,-1,0,1,2,],
[r'$really\ bad$','$bad$','$0$','$well$','$really\ well$'])
ax=plt.gca() #get current axis
ax.spines['right'].set_color('none') #邊框?qū)傩栽O(shè)置為None 不顯示
ax.spines['top'].set_color('none')
plt.show()
[-1. -0.25 0.5 1.25 2. ]
x=np.linspace(-3,3,50) #在(-3,3)之間生成50個樣本數(shù)
y1=2*x+1
y2=x**2
plt.figure(num=2,figsize=(8,5)) #定義編號為2,大小為(8,5)
plt.plot(x,y1,color='red',linewidth=2,linestyle='--')
plt.plot(x,y2)
plt.xlim(-1,2) #x軸的范圍
plt.ylim(-2,3) #y軸的范圍
plt.xlabel('x軸')
plt.ylabel('y軸')
new_ticks=np.linspace(-1,2,5) #-1到2分成5段,包含端點
print(new_ticks)
plt.xticks(new_ticks) #進(jìn)行替換新下標(biāo)
plt.yticks([-2,-1,0,1,2,],
[r'$really\ bad$','$bad$','$0$','$well$','$really\ well$'])
ax=plt.gca() #get current axis
ax.spines['right'].set_color('none') #邊框?qū)傩栽O(shè)置為None 不顯示
ax.spines['top'].set_color('none')
ax.xaxis.set_ticks_position('bottom') #設(shè)置x坐標(biāo)刻度數(shù)字或名稱的位置,所有屬性為:top,bottom,both,default,none
ax.spines['bottom'].set_position(('data',0)) # 設(shè)置.spines邊框x軸,設(shè)置.set_position設(shè)置邊框的位置,y=0位置;位置所有屬性有outward,axes,data
ax.yaxis.set_ticks_position('left')
ax.spines['left'].set_position(('data',0)) #坐標(biāo)中心點在(0,0)位置
plt.show()
[-1. -0.25 0.5 1.25 2. ]
x=np.linspace(-3,3,50)
y1=2*x+1
y2=x**2
plt.figure(num=2,figsize=(8,5))
plt.xlim(-1,2)
plt.ylim(-2,3)
new_ticks=np.linspace(-1,2,5)
plt.xticks(new_ticks)
plt.yticks([-2,-1,1,2,],
[r'$really\ bad$','$bad$','$well$','$really\ well$'])
l1,=plt.plot(x,y1,color='red',linewidth=2,linestyle='--',label='linear line')
l2,=plt.plot(x,y2,label='square line')
plt.legend(loc='best') #顯示在最好的位置,自動分配
plt.show() #顯示圖
x=np.linspace(-3,3,50)
y1=2*x+1
y2=x**2
plt.figure(num=2,figsize=(8,5))
plt.xlim(-1,2)
plt.ylim(-2,3)
new_ticks=np.linspace(-1,2,5)
plt.xticks(new_ticks)
plt.yticks([-2,-1,1,2,],
[r'$really\ bad$','$bad$','$well$','$really\ well$'])
l1,=plt.plot(x,y1,color='red',linewidth=2,linestyle='--',label='linear line')
l2,=plt.plot(x,y2,label='square line')
#單獨修改label的信息
plt.legend(loc='best',handles=[l1,l2],labels=['up','down']) #顯示在最好的位置,自動分配
plt.show() #顯示圖
loc中的參數(shù):
best
upper right
upper left
lower left
lower right
right
center right
lower center
upper center
center
x=np.linspace(-3,3,50)
y=2*x+1
plt.figure(num=1,figsize=(8,5))
plt.plot(x,y)
#移動坐標(biāo)軸
ax=plt.gca()
ax.spines['right'].set_color('none')
ax.spines['top'].set_color('none')
ax.xaxis.set_ticks_position('bottom')
ax.spines['bottom'].set_position(('data',0))
ax.yaxis.set_ticks_position('left')
ax.spines['left'].set_position(('data',0))
#標(biāo)注信息
x0=1
y0=2*x0+1
plt.scatter(x0,y0,color='b')
plt.plot([x0,x0],[y0,0],'k--',lw=2.5) #連接兩個點,k表示黑色,lw=line weight 線粗細(xì)
plt.annotate(r'$2x0+1=%s$' % y0,xy=(x0,y0),xycoords='data',xytext=(+30,-30),textcoords='offset points',fontsize=16,
arrowprops=dict(arrowstyle='->',connectionstyle='arc3,rad=.2'))
#xycoords='data' 基于數(shù)據(jù)的值來選位置,xytext=(+30,-30),對于標(biāo)注位置的描述,textcoords='offset points',xy偏差值,arrowprops對圖中箭頭類型設(shè)置
plt.text(-3.7,3,r'$This\ is\ the\ some\ text. \mu\ \sigma_i\ \alpha_t$',fontdict={'size':16,'color':'r'})
plt.show()
x=np.linspace(-3,3,50)
y=0.1*x
plt.figure()
plt.plot(x,y,linewidth=10,zorder=1)
plt.ylim(-2,2)
#移動坐標(biāo)軸
ax=plt.gca()
ax.spines['right'].set_color('none')
ax.spines['top'].set_color('none')
ax.xaxis.set_ticks_position('bottom')
ax.spines['bottom'].set_position(('data',0))
ax.yaxis.set_ticks_position('left')
ax.spines['left'].set_position(('data',0))
#label.set_fontsize(12) 重新調(diào)整字體的大小,bbox設(shè)置目的內(nèi)容透明度相關(guān)系數(shù),facecolor調(diào)節(jié)box景色
#edgecolor設(shè)置邊框 ,alpha設(shè)置透明度,zorder設(shè)置圖層順序
for label in ax.get_xticklabels()+ax.get_yticklabels():
label.set_fontsize(12)
label.set_bbox(dict(facecolor='red',edgecolor='None',alpha=0.7,zorder=2))
plt.show()
8.1 Scatter散點圖
n=1024
X=np.random.normal(0,1,n)
Y=np.random.normal(0,1,n)
T=np.arctan2(Y,X) #arctan2返回給定的X和Y值的反正切值
#scatter畫散點圖,size=75,顏色為T,透明度為50%,利用xticks函數(shù)來隱藏x坐標(biāo)軸
plt.scatter(X,Y,s=75,c=T,alpha=0.5)
plt.xlim(-1.5,1.5)
plt.xticks(()) #忽略xticks
plt.ylim(-1.5,1.5)
plt.yticks(()) #忽略yticks
plt.show()8.2 Bar條形圖
n=12
X=np.arange(n)
Y1=(1-X/float(n))*np.random.uniform(0.5,1,n)
Y2=(1-X/float(n))*np.random.uniform(0.5,1,n)
plt.bar(X,+Y1,facecolor='#9999ff',edgecolor='white')
plt.bar(X,-Y2,facecolor='#ff9999',edgecolor='white')
#標(biāo)記值
for x,y in zip(X,Y1): #zip表示可以傳遞兩個值
plt.text(x+0.4,y+0.5,'%.2f'%y,ha='center',va='bottom') #ha表示橫向?qū)R,bottom表示向下對齊
for x,y in zip(X,Y2):
plt.text(x+0.4,-y-0.05,'%.2f'%y,ha='center',va='top')
plt.xlim(-0.5,n)
plt.xticks(())
plt.ylim(-1.25,1.25)
plt.yticks(())
plt.show()
n=256
x=np.linspace(-3,3,n)
y=np.linspace(-3,3,n)
X,Y=np.meshgrid(x,y) #從坐標(biāo)向量返回坐標(biāo)矩陣
#函數(shù)用來計算高度值,利用contour函數(shù)把顏色加進(jìn)去,位置參數(shù)依次為x,y,f(x,y),透明度為0.75,并將f(x,y)的值對應(yīng)到camp之中
def f(x,y):
return (1-x/2+x**5+y**3)*np.exp(-x**2-y**2)
plt.contourf(X,Y,f(X,Y),8,alpha=0.75,cmap=plt.cm.hot) #8表示等高線分成多少份,alpha表示透明度,cmap表示color map
C=plt.contour(X,Y,f(X,Y),8,colors='black',linewidth=0.5)
plt.clabel(C,inline=True,fontsize=10)
plt.xticks(()) #隱藏坐標(biāo)軸
plt.yticks(())
plt.show()
import matplotlib.pyplot as plt
import numpy as np
a = np.array([0.313660827978, 0.365348418405, 0.423733120134,
0.365348418405, 0.439599930621, 0.525083754405,
0.423733120134, 0.525083754405, 0.651536351379]).reshape(3,3)
plt.imshow(a, interpolation='nearest', cmap='bone', origin='lower')
plt.show()
interpolation_methods: 可以更改看看效果
<[None, 'none', 'nearest', 'bilinear', 'bicubic', 'spline16',
'spline36', 'hanning', 'hamming', 'hermite', 'kaiser', 'quadric',
'catrom', 'gaussian', 'bessel', 'mitchell', 'sinc', 'lanczos']
#利用matplotlib打印出圖像
a=np.array([0.313660827978,0.365348418405,0.423733120134,
0.365348418405,0.439599930621,0.525083754405,
0.423733120134,0.525083754405,0.651536351379]).reshape(3,3)
plt.imshow(a,interpolation='nearest',cmap='bone',origin='lower') #origin='lower'代表就是選擇原點位置
plt.colorbar(shrink=.92) #shrink參數(shù)是將圖片長度變?yōu)樵瓉淼?2%
plt.xticks(())
plt.yticks(())
plt.show()
<IPython.core.display.Javascript object>
import numpy as np
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D #需要導(dǎo)入模塊Axes3D
fig=plt.figure() #定義圖像窗口
ax=Axes3D(fig) #在窗口上添加3D坐標(biāo)軸
#將x和y值編織成柵格
X=np.arange(-4,4,0.25)
Y=np.arange(-4,4,0.25)
X,Y=np.meshgrid(X,Y)
R=np.sqrt(X**2+Y**2)
Z=np.sin(R) #高度值
#將colormap ranbow填充顏色,之后將三維圖像投影到XY平面做等高線圖,其中rstride和cstride表示row和column的寬度
ax.plot_surface(X,Y,Z,rstride=1,cstride=1,cmap=plt.get_cmap('rainbow')) #rstride表示圖像中分割線的跨圖
#添加XY平面等高線 投影到Z平面
ax.contourf(X,Y,Z,zdir='z',offset=-2,cmap=plt.get_cmap('rainbow')) #把圖像進(jìn)行投影的圖形 offset表示比0坐標(biāo)軸低兩個位置
ax.set_zlim(-2,2)
plt.show()
均勻圖中圖:MatPlotLib可以組合許多的小圖在大圖中顯示,使用的方法叫做subplot.
plt.figure()
plt.subplot(2,2,1) #表示將整個圖像分割成2行2列,當(dāng)前位置為1
plt.plot([0,1],[0,1]) #橫坐標(biāo)變化為[0,1] 豎坐標(biāo)變化為[0,2]
plt.subplot(2,2,2)
plt.plot([0,1],[0,2])
plt.subplot(2,2,3)
plt.plot([0,1],[0,3])
plt.subplot(2,2,4)
plt.plot([0,1],[0,4])
plt.show()
plt.figure()
plt.subplot(2,1,1) #表示將整個圖像分割成2行1列,當(dāng)前位置為1
plt.plot([0,1],[0,1]) #橫坐標(biāo)變化為[0,1] 豎坐標(biāo)變化為[0,2]
plt.subplot(2,3,4)
plt.plot([0,1],[0,2])
plt.subplot(2,3,5)
plt.plot([0,1],[0,3])
plt.subplot(2,3,6)
plt.plot([0,1],[0,4])
plt.show()
import matplotlib.gridspec as gridspec #引入新模塊
plt.figure()
#使用plt.subplot2grid創(chuàng)建一個小圖,(3,3)表示將整個圖像分割成三行三列,(0,0)表示從第0行0列開始作圖,
#colspan=3表示列的跨度為3.colspan和rowspan缺省時默認(rèn)跨度為1
ax1=plt.subplot2grid((3,3),(0,0),colspan=3)
ax1.plot([1,2],[1,2])
ax1.set_title('ax1_title') #設(shè)置圖的標(biāo)題
#將圖像分割成3行3列,從第1行0列開始作圖,列的跨度為2
ax2=plt.subplot2grid((3,3),(1,0),colspan=2)
#將圖像分割成3行3列,從第1行2列開始作圖,行的跨度為2
ax3=plt.subplot2grid((3,3),(1,2),rowspan=2)
#將圖像分割成3行3列,從第2行0列開始作圖,行與列的跨度默認(rèn)為1
ax4=plt.subplot2grid((3,3),(2,0))
ax4.scatter([1,2],[2,2])
ax4.set_xlabel('ax4_x')
ax4.set_ylabel('ax4_y')
ax5=plt.subplot2grid((3,3),(2,1))
plt.show()
plt.figure()
gs=gridspec.GridSpec(3,3) #將圖像分割成三行三列
ax6=plt.subplot(gs[0,:]) #gs[0:1]表示圖占第0行和所有列
ax7=plt.subplot(gs[1,:2]) #gs[1,:2]表示圖占第1行和前兩列
ax8=plt.subplot(gs[1:,2]) #gs[1,:]表示圖占后兩行的最后一列
ax9=plt.subplot(gs[-1,0])
ax10=plt.subplot(gs[-1,-2]) #gs[-1,-2]表示這個圖占倒數(shù)第一行和倒數(shù)第2列
plt.show()
#建立一個2行2列的圖像窗口,sharex=True表示共享x軸坐標(biāo),sharey=True表示共享y軸坐標(biāo),
#((ax11,ax12),(ax13,ax14))表示從左到右一次存放ax11,ax12,ax13,ax14
f,((ax11,ax12),(ax13,ax14))=plt.subplots(2,2,sharex=True,sharey=True)
ax11.scatter([1,2],[1,2]) #坐標(biāo)范圍x為[1,2],y為[1,2]
plt.tight_layout() #表示緊湊顯示圖像
plt.show()
fig=plt.figure()
#創(chuàng)建數(shù)據(jù)
x=[1,2,3,4,5,6,7]
y=[1,3,4,2,5,8,6]
#繪制大圖:假設(shè)大圖的大小為10,那么大圖被包含在由(1,1)開始,寬8高8的坐標(biāo)系之中
left,bottom,width,height=0.1,0.1,0.8,0.8
ax1=fig.add_axes([left,bottom,width,height]) #main axes
ax1.plot(x,y,'r') #繪制大圖,顏色為red
ax1.set_xlabel('x') #橫坐標(biāo)名稱為x
ax1.set_ylabel('y')
ax1.set_title('title') #圖名稱為title
#繪制小圖,注意坐標(biāo)系位置和大小的改變
ax2=fig.add_axes([0.2,0.6,0.25,0.25])
ax2.plot(y,x,'b') #顏色為bule
ax2.set_xlabel('x')
ax2.set_title('title inside 1')
#繪制第二個小圖
plt.axes([0.6,0.2,0.25,0.25])
plt.plot(y[::-1],x,'g') #將y進(jìn)行逆序
plt.xlabel('x')
plt.ylabel('y')
plt.title('title inside 2')
plt.show()
x=np.arange(0,10,0.1)
y1=0.5*x**2
y2=-1*y1
fig,ax1=plt.subplots()
ax2=ax1.twinx() #鏡像顯示
ax1.plot(x,y1,'g-')
ax2.plot(x,y2,'b-')
ax1.set_xlabel('x data')
ax1.set_ylabel('Y1 data',color='g') #第一個y坐標(biāo)軸
ax2.set_ylabel('Y2 data',color='b') #第二個y坐標(biāo)軸
plt.show()
from matplotlib import pyplot as plt
from matplotlib import animation
import numpy as np
fig, ax = plt.subplots()
#我們的數(shù)據(jù)是一個0~2π內(nèi)的正弦曲線
x = np.arange(0, 2*np.pi, 0.01)
line, = ax.plot(x, np.sin(x))
#接著,構(gòu)造自定義動畫函數(shù)animate,用來更新每一幀上各個x對應(yīng)的y坐標(biāo)值,參數(shù)表示第i幀
def animate(i):
line.set_ydata(np.sin(x + i/10.0))
return line,
#然后,構(gòu)造開始幀函數(shù)init
def init():
line.set_ydata(np.sin(x))
return line,
#接下來,我們調(diào)用FuncAnimation函數(shù)生成動畫。參數(shù)說明:
#fig 進(jìn)行動畫繪制的figure
#func 自定義動畫函數(shù),即傳入剛定義的函數(shù)animate
#frames 動畫長度,一次循環(huán)包含的幀數(shù)
#init_func 自定義開始幀,即傳入剛定義的函數(shù)init
#interval 更新頻率,以ms計
#blit 選擇更新所有點,還是僅更新產(chǎn)生變化的點。應(yīng)選擇True,但mac用戶請選擇False,否則無法顯示動畫
ani = animation.FuncAnimation(fig=fig,
func=animate,
frames=100,
init_func=init,
interval=20,
blit=False)
plt.show()
#圖中效果為一曲線向左移動
# 當(dāng)然,你也可以將動畫以mp4格式保存下來,但首先要保證你已經(jīng)安裝了ffmpeg 或者mencoder
# ani.save('basic_animation.mp4', fps=30, extra_args=['-vcodec', 'libx264'])