国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
干貨!統(tǒng)計學7種數(shù)據(jù)分析方法,超級實用

研究員在圖書館檔案中搜索計算機數(shù)據(jù)庫

Hi~盆友們!

今天的內容非常干貨,大家一定要看呀~~

做數(shù)據(jù)分析,就一定會涉及到統(tǒng)計學的知識。我之前還推了一些統(tǒng)計學相關的基礎知識。今天,我會分享7個我們很可能會用到的統(tǒng)計學中的數(shù)據(jù)分析方法。

一、描述統(tǒng)計

描述統(tǒng)計是通過圖表或數(shù)學方法,對數(shù)據(jù)資料進行整理、分析,并對數(shù)據(jù)的分布狀態(tài)、數(shù)字特征和隨機變量之間關系進行估計和描述的方法。

描述統(tǒng)計分為集中趨勢分析、離中趨勢分析、相關分析三大部分。

集中趨勢分析

集中趨勢分析主要靠平均數(shù)、中數(shù)、眾數(shù)等統(tǒng)計指標來表示數(shù)據(jù)的集中趨勢。

離中趨勢分析

離中趨勢分析主要靠全距、四分差、平均差、方差(協(xié)方差:用來度量兩個隨機變量關系的統(tǒng)計量)、標準差等統(tǒng)計指標來研究數(shù)據(jù)的離中趨勢。例如,我們想知道兩個教學班的語文成績中,哪個班級內的成績分布更分散,就可以用兩個班級的四分差或百分點來比較。

相關分析

相關分析探討數(shù)據(jù)之間是否具有統(tǒng)計學上的關聯(lián)性。

二、假設檢驗

假設檢驗是用來判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質差別造成的統(tǒng)計推斷方法。

假設檢驗可分為正態(tài)分布檢驗、正態(tài)總體均值分布檢驗、非參數(shù)檢驗三類。

正態(tài)分布檢驗

正態(tài)分布檢驗包括三類:JB檢驗、KS檢驗、Lilliefors檢驗,用于檢驗樣本是否來自于一個正態(tài)分布總體。

正態(tài)總體均值分布檢驗

正態(tài)總體均值分布檢驗考察系統(tǒng)誤差對測試結果的影響,從統(tǒng)計意義上來說,各樣本均值之差應在隨機誤差允許的范圍之內。反之,如果不同樣本的均值之差超過了允許的范圍,這就說明除了隨機誤差之外,各均值之間還存在系統(tǒng)誤差,使得各均值之間出現(xiàn)了顯著性差異。

分為兩種情況:

T檢驗:主要用于樣本含量較小,總體標準差未知的正態(tài)分布資料。它用T分布理論來推斷差異發(fā)生的概率,從而判定兩個平均數(shù)的差異是否顯著。

U檢驗:一般用于大樣本的平均值差異性檢驗,基于樣本來自正態(tài)總體的假設。它是用標準正態(tài)分布的理論來推斷差異發(fā)生的概率,從而比較兩個平均數(shù)的差異是否顯著。國外英文統(tǒng)計學大多采用Z檢驗。

非參數(shù)檢驗

非參數(shù)檢驗不考慮總體分布是否已知,僅應用樣本觀察值中一些非常直觀的信息。適用情況包括:待分析數(shù)據(jù)不滿足參數(shù)檢驗所要求的假定,因而無法應用參數(shù)檢驗;僅由一些等級構成的數(shù)據(jù);所提的問題中并不包含參數(shù);需要迅速得出結果時。它的主要方法包括:卡方檢驗、秩和檢驗、二項檢驗、游程檢驗、K-量檢驗、符號檢驗等。

三、相關分析

相關分析是研究現(xiàn)象之間相互關系的主要方式之一,它可以將現(xiàn)象之間的關系大小與方向測定出來。相關關系的類型按照不同維度可分為:

按相關程度劃分:完全相關、不相關、不完全相關。

按依存關系的表現(xiàn)形式劃分:線性相關、非線性相關。

按相關方向劃分:正相關、負相關。

按研究量劃分:單相關、復相關。

相關關系的測定方法包括:散點圖、相關系數(shù)等。

四、回歸分析

回歸分析是確定兩種或兩種以上變量間相互依賴的定量關系的一種統(tǒng)計分析方法。它按照變量的多少和變量之間的關系類型,可分為多種回歸:

一元線性回歸分析

分析一個因變量與一個自變量之間的線性關系,常用統(tǒng)計指標包括: 平均數(shù)、增減量、平均增減量。

多元線性回歸分析

分析多個自變量與一個因變量之間的線性關系,在實際統(tǒng)計分析中,一般利用軟件對多元回歸模型進行估計。

非線性回歸分析

自變量與因變量之間因果關系的函數(shù)表達式是非線性的,非線性回歸模型有很多包括對數(shù)曲線方程、反函數(shù)曲線方程、二次曲線方程、三次曲線方程、復合曲線方程、冪函數(shù)曲線方程 、S形曲線方程等均為非線性回歸方程。

其它回歸分析模型還有很多,之前有寫過一篇回歸分析的內容,想了解的小伙伴可以去看,這里就不贅述啦!

常見的10個回歸分析模型算法,果斷收藏

五、方差分析

方差分析又稱“變異數(shù)分析”或“F檢驗”,用于兩個及兩個以上樣本均數(shù)差別的顯著性檢驗。使用條件包括:各樣本須是相互獨立的隨機樣本;各樣本來自正態(tài)分布總體;各總體方差相等。

根據(jù)所分析的試驗因素個數(shù)多少,可分為:

單因素方差分析

用來研究一個控制變量的不同水平是否對觀測變量產生了顯著影響。這里,由于僅研究單個因素。

雙因素方差分析

用來分析兩個因素的不同水平對結果是否有顯著影響,以及兩因素之間是否存在交互效應。

六、聚類分析

聚類分析是一種探索性的分析,在分類的過程中,人們不必事先給出一個分類的標準,聚類分析能夠從樣本數(shù)據(jù)出發(fā),將數(shù)據(jù)分類到不同的類或者簇。同一個簇中的對象有很大的相似性,而不同簇間的對象有很大的相異性。

聚類分析的計算方法主要有:

分裂法

首先創(chuàng)建k個劃分,k為要創(chuàng)建的劃分個數(shù)。然后利用一個循環(huán)定位技術通過將對象從一個劃分移到另一個劃分來幫助改善劃分質量。典型的劃分方法包括:k-means、k-medoids、CLARA、CLARANS、FCM等。

層次法

創(chuàng)建一個層次以分解給定的數(shù)據(jù)集,可以分為自上而下(分解)和自下而上(合并)兩種操作方式。方法包括:BIRCH、CURE、ROCK、CHEMALOEN等。

基于密度的方法

根據(jù)密度完成對象的聚類。方法包括:DBSCAN、OPTICS等。

基于網格的方法

先將對象空間劃分為有限個單元以構成網格結構,然后利用網格結構完成聚類。方法包括:STING、CLIQUE等。

基于模型的方法

假設每個聚類的模型并發(fā)現(xiàn)適合相應模型的數(shù)據(jù)。方法包括:COBWEB、CLASSIT等。

七、時間序列分析

時間序列是同一現(xiàn)象在不同時間上的觀察數(shù)據(jù)按時間先后順序排列起來所得到的數(shù)列,也稱為動態(tài)數(shù)列。時間序列的兩個基本要素:現(xiàn)象所屬的時間和反映現(xiàn)象在不同時間上的指標數(shù)值。

時間序列按排列指標的表現(xiàn)形式不同,可分為:

絕對數(shù)時間序列

指一系列同類的總量指標數(shù)據(jù)按時間先后順序排列而形成的序列,反映現(xiàn)象在各個時期上達到的絕對水平。又分為:時點序列和時期序列。

相對數(shù)時間序列

指相對指標數(shù)值按時間先后順序排列而形成的時間序列,主要反映的是客觀現(xiàn)象數(shù)量對比關系的發(fā)展過程。

平均數(shù)時間序列

指一系列同類的平均指標數(shù)值依時間順序排列形成的數(shù)列,主要反映的是客觀現(xiàn)象一般水平的發(fā)展變化過程。又可分為:靜態(tài)平均數(shù)時間序列和動態(tài)平均數(shù)時間序列。

時間序列的分析模型,按影響因素可劃分為:

長期趨勢的測定和分析方法:時距擴大法、移動平均法、最小二乘法。

季節(jié)變動的測定和分析方法:同期平均法、移動平均趨勢剔除法。

循環(huán)變動的測定和分析方法:直接法和剩余法。

當然了,統(tǒng)計學遠遠不止這7種數(shù)據(jù)分析方法,還有很多其他方法值得我們深挖學習,如通徑分析、因子分析、主成分分析等。如果以后要做數(shù)據(jù)分析,一定要學習更多統(tǒng)計學的基礎知識。

本站僅提供存儲服務,所有內容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權內容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
常用統(tǒng)計學方法概述
大數(shù)據(jù):數(shù)據(jù)分析方法論是什么?
SAS系列32:SAS高級統(tǒng)計(一)
4門統(tǒng)計學你選擇哪個
數(shù)據(jù)分析方法匯總
科研資料的分析思路 - 醫(yī)生生活 - DonewsBlog
更多類似文章 >>
生活服務
分享 收藏 導長圖 關注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服