国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
R是一種生活,統(tǒng)計(jì)是一種態(tài)度

有多少人聽說過R軟件?有多少人用過R軟件?你現(xiàn)在最常用的軟件是什么?SAS?SPSS?EViews?如果你是一個(gè)經(jīng)常和數(shù)據(jù)分析打交道的人,或者從事金融建模,數(shù)學(xué)建模的人員,還不用R,你就有點(diǎn)out了。如果現(xiàn)在不學(xué)R,五年后你沒有任何優(yōu)勢可言;如果5年后,你還不學(xué)R,那你差不多就可以被淘汰了。

接下來,我先介紹一下R軟件,然后,會(huì)詳細(xì)的講解為什么你不用R就會(huì)out。

R是有Ross Ihaka跟Robert一起開發(fā)的一個(gè)面向?qū)ο蟮木幊陶Z言。什么是面向?qū)ο竽??就像現(xiàn)在,我在這里演講,直接看見你們,你們就是我面向的對象,當(dāng)然,這是開玩笑。面向?qū)ο蟮囊馑季褪?,R里面的一切東西都是視為對象(Object)。無論是數(shù)據(jù)框、列表還是函數(shù)或者環(huán)境,這里先不講,免得把大家嚇跑了。

R語言的前身是S語言,這個(gè)語言一度是數(shù)據(jù)分析領(lǐng)域里面的標(biāo)準(zhǔn)語言。當(dāng)然,現(xiàn)在也是,但是正在逐步被R語言取代。S語言是由貝爾實(shí)驗(yàn)室開發(fā)的,貝爾實(shí)驗(yàn)室開發(fā)了很多經(jīng)典的東西,S是其中之一。S語言的缺點(diǎn)是它不是免費(fèi)的,而R最大的優(yōu)點(diǎn)在于R是免費(fèi)的。

現(xiàn)在很多人用SPSS,SAS,MatLab,但是用的都是盜版軟件。從法律上來講這是非法的,但是非法的東西在中國很流行,很多教授也用這些非法軟件,并且還幫著同學(xué)去獲取盜版軟件,其實(shí),這不太可取。當(dāng)然,在感情上我予以充分理解。

上次去上海參加第4屆R會(huì)議,來了一個(gè)嘉賓是新西蘭人,新西蘭是R的故鄉(xiāng),中間熊熹提到她復(fù)印了一本ggplot2的書,被外國人看到,外國人就問她征求過版權(quán)問題嗎?在外國人看來這是很嚴(yán)肅的事情。當(dāng)然,這是題外話。

免費(fèi)是R很大的優(yōu)點(diǎn),但不是唯一的。R的最大優(yōu)點(diǎn)是出色的作圖功能、豐富的統(tǒng)計(jì)學(xué)方法以及超快的更新速度。下面講一下R的各種功能。

首先,R可以作為計(jì)算器使用,例如(屏幕演示)。其次,出色的繪圖功能,例如(屏幕演示,直方圖,小提琴圖),還可以繪制一些高級的圖形,向日葵圖,玫瑰花瓣圖,臉譜圖。當(dāng)然,這是最基本的功能。雖然很基本,SPSS這些軟件是不可能做到這么完美的。R的畫圖分四個(gè)層級,最基本的就是剛才演示的。高級一點(diǎn)的是grid,然后是,Lattice,Lattice的圖形是這樣的(屏幕演示),很適合做多元數(shù)據(jù)展示。grid是這樣的(屏幕演示),grid圖形引入了圖層概念,并且可以切換圖形的視角。舉個(gè)例子:(A4紙演示),接下來是ggpolt2:ggplot2是一個(gè)更具有創(chuàng)新性的繪圖設(shè)備,它創(chuàng)建了自己的語法,相當(dāng)于R里面有創(chuàng)建了一門新的繪圖語言。ggplot2的功能是這樣的(屏幕演示)。最后,比較終極的繪圖BOSS是ggobi,這是一個(gè)動(dòng)態(tài)的繪圖軟件,交互性很強(qiáng),不過可能很快要被謝益輝的cecran給取代了。后者是前者的加強(qiáng)版。

然后,就是R建模。R的建模能力超強(qiáng)。建立線性模型,只需要用lm函數(shù)就可以了,廣義線性模型glm就可以了,廣義可加模型gam就可以了。

然后是,時(shí)間序列分析。這個(gè)很有用的。我覺得,對于本科生也好,研究生也好,想基于一元或者多元回歸做一個(gè)比較上層次的論文是困難的。但是,用時(shí)間序列分析是可以的,可以用arima,說到這里很多人就笑了,arima這個(gè)我知道,終于聽到一個(gè)自己知道的模型了,其次是garch模型。我知道很多人做garch模型用EViews,但是這個(gè)軟件太老了,極其不智能,稍微高級的方法都用不了。加一個(gè)外生變量要折騰半天。而且最重要的是你用的是盜版軟件,話說過來,即使是正版的Eviews也不智能。R里面做garch模型就很簡單,用rgarch包就可以了,可以構(gòu)建各種高級的garch模型,tgarch,igarch,gjrgarch之類的,還有高級的Dccgarch,可能你又聽不懂了,還有更高階的BEKK模型,BEKK沒什么神秘的,其實(shí)就是多元GARCH模型,就是把GARCH模型從一維推廣到了二維了。還有更高階的,因?yàn)閰?shù)估計(jì)起來太麻煩,所以應(yīng)用比較少。

Rgarch包還能計(jì)算VaR。也就是Value at Risk。風(fēng)險(xiǎn)價(jià)值。這個(gè)東西很高級,沒有聽過吧?其實(shí),我認(rèn)為上了大三的人就應(yīng)該很熟悉VaR。但是很多人不知道,因?yàn)橹袊慕逃惶晒Γ覀兘胁怀晒?,不叫失敗,免得打擊教育部。高校的老師,怎么說呢,比較善于推己及人。他們當(dāng)年讀大三的時(shí)候,就不懂得VaR,他們復(fù)習(xí)半年,考上研究生的時(shí)候也不怎么懂。所以他們認(rèn)為別的本科生也不懂,或者說沒有能力懂。他們對中國的學(xué)生太沒有信心了。其實(shí),VaR的概念并不是很難。(演示)

這就是VaR,其實(shí)就是分位數(shù)。分位數(shù)其實(shí)就是對密度函數(shù)求變上限的積分,求變上限的積分都會(huì)吧?不過,也不用手動(dòng)求,用R就可以了。

理論上講,只要知道了密度函數(shù),求積分不在話下。所以求密度函數(shù)其實(shí)是VaR的核心。根據(jù)求VaR密度函數(shù)的方法的不同,可以將它分成三種重用的方法,歷史模擬法,蒙特卡洛模擬法,方差-協(xié)方差法。歷史模擬法就是用歷史數(shù)據(jù)的密度函數(shù)代替未來的密度函數(shù),蒙特卡洛模擬法就是假設(shè)一個(gè)分布,模擬一批隨機(jī)數(shù)。說到隨機(jī)數(shù),想起來本科期間一件事情,當(dāng)時(shí)精算專業(yè)要生成隨機(jī)數(shù),一批學(xué)生不知道怎么做,在Excel里面瞎折騰。我就想不明白,為什么不用R呢,產(chǎn)生正態(tài)分布的隨機(jī)數(shù)rnorm(5)就可以了,產(chǎn)生5萬個(gè),rnorm(50000),在Excel里面,折騰死你。

蒙特卡洛模擬完隨機(jī)數(shù),就根據(jù)這一批樣本來計(jì)算VaR。方差-協(xié)方差呢,跟這個(gè)不同,它求的是條件密度函數(shù),理論上講應(yīng)該更準(zhǔn)確。歷史模擬法對歷史區(qū)間的選擇很敏感;蒙特卡洛對分布的假設(shè)很敏感,正態(tài)分布假設(shè)和t分布假設(shè)結(jié)果相差很大;方差-協(xié)方差對厚尾與否很敏感。

如果是單個(gè)資產(chǎn)的話,像上面這樣求分位數(shù)就搞定了。資產(chǎn)組合的時(shí)候,要知道聯(lián)合分布,才能求分位數(shù)。聯(lián)合分布怎么求,最新的方法是Copula。簡單而言就是個(gè)復(fù)合函數(shù):假設(shè)你有聯(lián)合分布函數(shù)F(x1,x2,x3,…),有邊際分布,f(x1),f(x2),f(x3)…要找到要個(gè)函數(shù)H(·)使得F(x1,x2,x3,…)=H(f(x1),f(x2),f(x2)…)。

這個(gè)函數(shù)就是Copula。這是工作原理,操作起來有一系列復(fù)雜的技術(shù)。當(dāng)然,求解這個(gè)過程計(jì)算機(jī)會(huì)幫忙的,不需要手算。君子善假于物也。

本科生的時(shí)候做過一個(gè)項(xiàng)目是關(guān)于VaR的。當(dāng)時(shí)學(xué)校的一個(gè)老師提出過質(zhì)疑,因?yàn)閂aR的最初定義是是關(guān)于頭寸的。而R里面是基于收益率的。兩者在測量風(fēng)險(xiǎn)方面沒什么差異。但是,他非得堅(jiān)持算頭寸。答辯的時(shí)候,我跟他講這是很容易換算的,他問怎么容易。我就解釋給他,當(dāng)時(shí)年少無知,連續(xù)向他發(fā)問,我估計(jì)他很久沒有看最新的VaR文獻(xiàn)了,因此,我質(zhì)疑的問題,他一個(gè)都答不上來,后面聽答辯的同學(xué),開始?xì)g呼,掌聲雷動(dòng)。我很了解同齡人,大家都喜歡看見權(quán)威被打倒。這是潛在的暴力傾向,我很不喜歡。值得注意的是,劉姝威老師也在下面拍手。

現(xiàn)在想起來當(dāng)時(shí)太沖動(dòng)了,事后我試圖向那個(gè)老師道歉。當(dāng)然,不是因?yàn)槲矣缅e(cuò)了方法,只是因?yàn)槲矣缅e(cuò)了態(tài)度。我覺得一個(gè)人還是應(yīng)該尊重另一個(gè)人的。

劉姝威老師后來說,本科生能做出來這個(gè)VaR是很不容易的。我當(dāng)時(shí)心里很舒服,得到了贊賞。后來想想,這個(gè)贊賞的代價(jià)很大。VaR明明很容易計(jì)算,她卻因?yàn)檫@個(gè)兒稱贊我,那不是在貶低其他所有的不會(huì)算VaR的同學(xué)嗎?這是我后來想明白的。

R還能做極值理論。今年上海交大的一個(gè)研究生問我用R作極值理論的東西,我就幫他說了一下,他說幫了他大忙。說要感謝我,我說不用,在論文后面,鳴謝一下就可以了。其實(shí),我心里一直在懷疑,研究生要畢業(yè)了,極值理論都還不懂,研究生到底讀的是神馬?更進(jìn)一步,這樣的人為什么能踏過研究生的門檻,問什么能考上研究生呢?中國的研究生錄取機(jī)制有問題。

再之外,R在數(shù)據(jù)挖掘領(lǐng)域是頂呱呱的。里面有各種方法,比如隨機(jī)森林,支持向量機(jī),Lasso等。什么是Lasso,也許你說,那是lasso,我跟你說,你說錯(cuò)了,這個(gè)單詞的重音在第二個(gè)。關(guān)于這方面,劉思喆是專家,你們可以到論壇上或者微博上咨詢他。

R能做的東西很多。那有沒有R不能做到的事情?讓我想一想,好像還真有。比如,R好像不能下電影,看電影,聽音樂。不過,R里面卻是提供了很多高級的工具,它提供了一個(gè)hook,可以啟動(dòng)電腦中的其他程序,比如迅雷,可以自動(dòng)下載網(wǎng)頁附件,自動(dòng)解壓縮,讀入數(shù)據(jù)等等。很多R粉絲甚至用R關(guān)機(jī),用R發(fā)微博,發(fā)校內(nèi)狀態(tài)。R能給人很多驚喜,比如用R下五子棋,掃雷,玩兒遞歸漢諾塔。做賀卡,馬賽克圖,這里面是什么知道嗎?是AV女優(yōu),不信你看看,是不是發(fā)現(xiàn)了很多熟人?

話說回來,很長一段時(shí)間里。SPSS,SAS,Matlab還會(huì)繼續(xù)存在,不會(huì)驟然消失。我甚至認(rèn)為這些軟件不會(huì)消失。因?yàn)樗€是有自己的受眾的。你不能要求所有人的都學(xué)習(xí)R編程。

這些軟件也有些優(yōu)點(diǎn),我最喜歡Matlab,他跟R有點(diǎn)像。好吧R跟matlab有點(diǎn)像,免得傷害Matlab user的感情。曾經(jīng)有一個(gè)人發(fā)了一段代碼,讓用R實(shí)現(xiàn)。我不知道那人是什么動(dòng)機(jī)。是想看看R能不能做到,還是想看看COS有沒有人會(huì)。很不好意思,我兩者都會(huì)一點(diǎn),于是我就用R重現(xiàn)了那個(gè)過程,代碼極其簡單。后來,那人說,太牛了,這都能做到。其實(shí),我想說,這不算什么。真的。牛人都在做更重要的事情。

我希望將來隨著時(shí)日推移、隨著SPSS,SAS,Matlab這一批老人家的辭世,R能快速的成長起來,老人家不愿意學(xué)編程,這一點(diǎn)我是很理解的,但是,他們阻礙了R的崛起,R將來勢必是一種潮流。

目前,市場上流行一個(gè)觀點(diǎn)。即數(shù)據(jù)越便宜,數(shù)據(jù)分析技術(shù)越昂貴。我早就意識到了這個(gè)問題,目前中國獲取數(shù)據(jù)很難,大家都把數(shù)據(jù)當(dāng)資源來買。國外就是不一樣,國外開放很多數(shù)據(jù),因?yàn)閲庹J(rèn)為,數(shù)據(jù)里面的信息才是資源。我把數(shù)據(jù)源放開,你有本事就從里面尋找信息吧。所以,國外分析數(shù)據(jù)的人就很貴。

將來,中國的數(shù)據(jù)提供商肯定會(huì)轉(zhuǎn)型,會(huì)開始搞咨詢,搞分析,而不是單純的賣數(shù)據(jù)。賣數(shù)據(jù)沒有前途。他們不賣數(shù)據(jù)了,數(shù)據(jù)分析師就會(huì)開始值錢了。這一天,我相信很快就到來了。

R這么好,如何學(xué)習(xí)R呢?我推薦一些材料給大家。一個(gè)是Rforbeginner,R導(dǎo)論。看完之后,看一下Rin a Nutshell,接著看The R book或者Statistics with R。這些資源基本都是開放的。

你們也可以跟著學(xué)校的老師學(xué),如果有用R的老師的話,實(shí)在不行就靠自己自學(xué),來論壇問也是可以的。

總之,R是一片廣闊的海域,你認(rèn)為自己有理想,就放馬過來吧。加入時(shí)代的浪潮,Come on!最后一點(diǎn)希望,希望在做的各位,將來畢業(yè)時(shí)都能夠?qū)懗鲆黄恋恼撐?,不要抄襲!

祝各位身體健康,天天快樂,謝謝!

本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊舉報(bào)。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
R語言風(fēng)險(xiǎn)價(jià)值:ARIMA,GARCH,Delta-normal法滾動(dòng)估計(jì)VaR(Value at Risk)和回測分析股票數(shù)據(jù)
謝益輝: 統(tǒng)計(jì)學(xué)專業(yè)應(yīng)該使用什么樣的統(tǒng)計(jì)軟件(寫給在統(tǒng)計(jì)學(xué)院學(xué)習(xí)的學(xué)弟學(xué)妹之四) | 統(tǒng)計(jì)之都 (中國統(tǒng)計(jì)學(xué)門戶網(wǎng)站,免費(fèi)統(tǒng)計(jì)學(xué)服務(wù)平臺)
總有一款適合你!數(shù)據(jù)挖掘四大名器
競爭風(fēng)險(xiǎn)數(shù)據(jù)的統(tǒng)計(jì)分析方法(PART Ⅱ)
Bootstrap再抽樣方法簡介
GARCH(1,1),MA以及歷史模擬法的的VaR比較
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服