人工智能的浪潮正在席卷全球,諸多詞匯時(shí)刻縈繞在我們耳邊:人工智能(Artificial Intelligence)、機(jī)器學(xué)習(xí)(Machine Learning)、深度學(xué)習(xí)(Deep Learning)。不少人對這些高頻詞匯的含義及其背后的關(guān)系總是似懂非懂、一知半解。
為了幫助大家更好地理解人工智能,這篇文章用最簡單的語言解釋了這些詞匯的含義,理清它們之間的關(guān)系,希望對剛?cè)腴T的同行有所幫助。
人工智能:從概念提出到走向繁榮
1956年,幾個(gè)計(jì)算機(jī)科學(xué)家相聚在達(dá)特茅斯會(huì)議,提出了“人工智能”的概念,夢想著用當(dāng)時(shí)剛剛出現(xiàn)的計(jì)算機(jī)來構(gòu)造復(fù)雜的、擁有與人類智慧同樣本質(zhì)特性的機(jī)器。其后,人工智能就一直縈繞于人們的腦海之中,并在科研實(shí)驗(yàn)室中慢慢孵化。之后的幾十年,人工智能一直在兩極反轉(zhuǎn),或被稱作人類文明耀眼未來的預(yù)言,或被當(dāng)成技術(shù)瘋子的狂想扔到垃圾堆里。直到2012年之前,這兩種聲音還在同時(shí)存在。
2012年以后,得益于數(shù)據(jù)量的上漲、運(yùn)算力的提升和機(jī)器學(xué)習(xí)新算法(深度學(xué)習(xí))的出現(xiàn),人工智能開始大爆發(fā)。據(jù)領(lǐng)英近日發(fā)布的《全球AI領(lǐng)域人才報(bào)告》顯示,截至2017年一季度,基于領(lǐng)英平臺(tái)的全球AI(人工智能)領(lǐng)域技術(shù)人才數(shù)量超過190萬,僅國內(nèi)人工智能人才缺口達(dá)到500多萬。
人工智能的研究領(lǐng)域也在不斷擴(kuò)大,圖一展示了人工智能研究的各個(gè)分支,包括專家系統(tǒng)、機(jī)器學(xué)習(xí)、進(jìn)化計(jì)算、模糊邏輯、計(jì)算機(jī)視覺、自然語言處理、推薦系統(tǒng)等。
圖一 人工智能研究分支
但目前的科研工作都集中在弱人工智能這部分,并很有希望在近期取得重大突破,電影里的人工智能多半都是在描繪強(qiáng)人工智能,而這部分在目前的現(xiàn)實(shí)世界里難以真正實(shí)現(xiàn)(通常將人工智能分為弱人工智能和強(qiáng)人工智能,前者讓機(jī)器具備觀察和感知的能力,可以做到一定程度的理解和推理,而強(qiáng)人工智能讓機(jī)器獲得自適應(yīng)能力,解決一些之前沒有遇到過的問題)。
弱人工智能有希望取得突破,是如何實(shí)現(xiàn)的,“智能”又從何而來呢?這主要?dú)w功于一種實(shí)現(xiàn)人工智能的方法——機(jī)器學(xué)習(xí)。
機(jī)器學(xué)習(xí):一種實(shí)現(xiàn)人工智能的方法
機(jī)器學(xué)習(xí)最基本的做法,是使用算法來解析數(shù)據(jù)、從中學(xué)習(xí),然后對真實(shí)世界中的事件做出決策和預(yù)測。與傳統(tǒng)的為解決特定任務(wù)、硬編碼的軟件程序不同,機(jī)器學(xué)習(xí)是用大量的數(shù)據(jù)來“訓(xùn)練”,通過各種算法從數(shù)據(jù)中學(xué)習(xí)如何完成任務(wù)。
舉個(gè)簡單的例子,當(dāng)我們?yōu)g覽網(wǎng)上商城時(shí),經(jīng)常會(huì)出現(xiàn)商品推薦的信息。這是商城根據(jù)你往期的購物記錄和冗長的收藏清單,識(shí)別出這其中哪些是你真正感興趣,并且愿意購買的產(chǎn)品。這樣的決策模型,可以幫助商城為客戶提供建議并鼓勵(lì)產(chǎn)品消費(fèi)。
機(jī)器學(xué)習(xí)直接來源于早期的人工智能領(lǐng)域,傳統(tǒng)的算法包括決策樹、聚類、貝葉斯分類、支持向量機(jī)、EM、Adaboost等等。從學(xué)習(xí)方法上來分,機(jī)器學(xué)習(xí)算法可以分為監(jiān)督學(xué)習(xí)(如分類問題)、無監(jiān)督學(xué)習(xí)(如聚類問題)、半監(jiān)督學(xué)習(xí)、集成學(xué)習(xí)、深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。
傳統(tǒng)的機(jī)器學(xué)習(xí)算法在指紋識(shí)別、基于Haar的人臉檢測、基于HoG特征的物體檢測等領(lǐng)域的應(yīng)用基本達(dá)到了商業(yè)化的要求或者特定場景的商業(yè)化水平,但每前進(jìn)一步都異常艱難,直到深度學(xué)習(xí)算法的出現(xiàn)。
深度學(xué)習(xí):一種實(shí)現(xiàn)機(jī)器學(xué)習(xí)的技術(shù)
深度學(xué)習(xí)本來并不是一種獨(dú)立的學(xué)習(xí)方法,其本身也會(huì)用到有監(jiān)督和無監(jiān)督的學(xué)習(xí)方法來訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)。但由于近幾年該領(lǐng)域發(fā)展迅猛,一些特有的學(xué)習(xí)手段相繼被提出(如殘差網(wǎng)絡(luò)),因此越來越多的人將其單獨(dú)看作一種學(xué)習(xí)的方法。
最初的深度學(xué)習(xí)是利用深度神經(jīng)網(wǎng)絡(luò)來解決特征表達(dá)的一種學(xué)習(xí)過程。深度神經(jīng)網(wǎng)絡(luò)本身并不是一個(gè)全新的概念,可大致理解為包含多個(gè)隱含層的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。為了提高深層神經(jīng)網(wǎng)絡(luò)的訓(xùn)練效果,人們對神經(jīng)元的連接方法和激活函數(shù)等方面做出相應(yīng)的調(diào)整。其實(shí)有不少想法早年間也曾有過,但由于當(dāng)時(shí)訓(xùn)練數(shù)據(jù)量不足、計(jì)算能力落后,因此最終的效果不盡如人意。
深度學(xué)習(xí)摧枯拉朽般地實(shí)現(xiàn)了各種任務(wù),使得似乎所有的機(jī)器輔助功能都變?yōu)榭赡?。無人駕駛汽車,預(yù)防性醫(yī)療保健,甚至是更好的電影推薦,都近在眼前,或者即將實(shí)現(xiàn)。其原因與以下因素息息相關(guān):
首先,深度卷積神經(jīng)網(wǎng)絡(luò)需要大量數(shù)據(jù)進(jìn)行訓(xùn)練。網(wǎng)絡(luò)深度太淺的話,識(shí)別能力往往不如一般的淺層模型,比如SVM或者boosting;如果做得很深,就需要大量數(shù)據(jù)進(jìn)行訓(xùn)練,否則機(jī)器學(xué)習(xí)中的過擬合將不可避免。而2006年開始,正好是互聯(lián)網(wǎng)開始大量產(chǎn)生各種各樣的圖片數(shù)據(jù)的時(shí)候,即視覺大數(shù)據(jù)開始爆發(fā)式地增長。
其次,是運(yùn)算能力。卷積神經(jīng)網(wǎng)絡(luò)對計(jì)算機(jī)的運(yùn)算要求比較高,需要大量重復(fù)可并行化的計(jì)算,在當(dāng)時(shí)CPU只有單核且運(yùn)算能力比較低的情況下,不可能進(jìn)行很深的卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練。隨著GPU計(jì)算能力的增長,卷積神經(jīng)網(wǎng)絡(luò)結(jié)合大數(shù)據(jù)的訓(xùn)練才成為可能。
最后,就是人和。卷積神經(jīng)網(wǎng)絡(luò)有一批一直在堅(jiān)持的科學(xué)家(如Lecun)才沒有被沉默,才沒有被海量的淺層方法淹沒。最后終于看到卷積神經(jīng)網(wǎng)絡(luò)占領(lǐng)主流的曙光。
有一點(diǎn)需要特別提醒的是,或許,深度學(xué)習(xí)更值得我們借鑒的是“深度”這一思想,但它是否等同于深度神經(jīng)網(wǎng)絡(luò),學(xué)者們的意見并非一致。比如,南京大學(xué)的周志華(西瓜書作者)提出了gcForest(多粒度級聯(lián)森林),在接受采訪時(shí),周志華老師認(rèn)為,解決復(fù)雜問題把模型變深可能是有必要的,但是深度學(xué)習(xí)應(yīng)該不只是深度神經(jīng)網(wǎng)絡(luò),還可以有其他形式,與神經(jīng)網(wǎng)絡(luò)相比,其他形式也許有更好的性質(zhì)。這段話或許會(huì)給我們深刻的警示。
三者的區(qū)別和聯(lián)系
機(jī)器學(xué)習(xí)是一種實(shí)現(xiàn)人工智能的方法,深度學(xué)習(xí)是一種實(shí)現(xiàn)機(jī)器學(xué)習(xí)的技術(shù)。我們就用最簡單的方法——同心圓,可視化地展現(xiàn)出它們?nèi)叩年P(guān)系。
圖二 三者關(guān)系示意圖
當(dāng)下的人工智能時(shí)代,機(jī)器學(xué)習(xí)的重要性不言而喻,為此,中科院自動(dòng)化所科研一線青年教師,推出《機(jī)器學(xué)習(xí):從理論到實(shí)踐》、《深度學(xué)習(xí):從理論到實(shí)踐》兩門在線直播課程。課程體系設(shè)置充分結(jié)合理論與實(shí)踐,PPT以及代碼均會(huì)提供給學(xué)員,并為學(xué)員搭建跟老師微信群即時(shí)交流的平臺(tái)。
機(jī)器學(xué)習(xí)課程內(nèi)容
1. 數(shù)學(xué)基礎(chǔ)(PPT資料)
1.1 矩陣論、概率論、優(yōu)化基礎(chǔ)知識(shí)
2. 機(jī)器學(xué)習(xí)算法:從理論到實(shí)踐(20學(xué)時(shí))
2.1 機(jī)器學(xué)習(xí)概述
2.1.1 機(jī)器學(xué)習(xí)方法分類
2.1.2 基礎(chǔ)知識(shí)介紹
2.2 KNN算法
2.2.1 概述與理論詳解
2.2.2 K近鄰應(yīng)用案例及代碼實(shí)現(xiàn)
2.1 機(jī)器學(xué)習(xí)概述
2.1.1 機(jī)器學(xué)習(xí)方法分類
2.1.2 基礎(chǔ)知識(shí)介紹
2.2 KNN算法
2.2.1 概述與理論詳解
2.2.2 K近鄰應(yīng)用案例及代碼實(shí)現(xiàn)
2.3 貝葉斯分類
2.3.1 樸素貝葉斯
2.3.2 貝葉斯決策論
2.3.3 NB分類算法應(yīng)用案例及代碼實(shí)現(xiàn)
2.4 回歸與分類
2.4.1 曲線擬合
2.4.2 線性回歸
2.4.3 logistic回歸
2.4.4 相關(guān)應(yīng)用案例及代碼實(shí)現(xiàn)
2.5 支持向量機(jī)
2.5.1 線性支持向量機(jī)
2.5.2 非線性支持向量機(jī)
2.5.3 核方法
2.5.4 SVM應(yīng)用案例及代碼實(shí)現(xiàn)
2.6 聚類算法
2.6.1 K均值聚類
2.6.2 層次聚類
2.6.3 聚類算法應(yīng)用案例及代碼實(shí)現(xiàn)
2.7 數(shù)據(jù)降維
2.7.1 線性降維
2.7.2 非線性降維
2.7.3 降維應(yīng)用案例及代碼實(shí)現(xiàn)
2.8 EM算法
2.8.1 EM算法基礎(chǔ)
2.8.2 多高斯參數(shù)估計(jì)
2.8.3 EM應(yīng)用案例及代碼實(shí)現(xiàn)
2.9 Adaboost算法
2.9.1 獨(dú)立于算法的機(jī)器學(xué)習(xí)
2.9.2 Adaboost算法
2.9.3 應(yīng)用案例及代碼實(shí)現(xiàn)
2.10 隱馬爾科夫模型
2.10.1 馬爾科夫
2.10.2 隱馬爾科夫模型
2.10.3 應(yīng)用案例及代碼實(shí)現(xiàn)
深度學(xué)習(xí)課程內(nèi)容
1. 數(shù)學(xué)基礎(chǔ)(PPT資料)
1.1 貝葉斯決策理論、參數(shù)與非參數(shù)估計(jì)
1.2 回歸與分類
1.3 梯度下降優(yōu)化
1.4 信息熵
2. 深度學(xué)習(xí)理論(6學(xué)時(shí))
2.1 前饋神經(jīng)網(wǎng)絡(luò)(概述、單層神經(jīng)網(wǎng)絡(luò)、多層神經(jīng)網(wǎng)絡(luò))
2.2 卷積神經(jīng)網(wǎng)絡(luò)(基本概念、發(fā)展歷程、網(wǎng)絡(luò)特點(diǎn)、網(wǎng)絡(luò)設(shè)置、網(wǎng)絡(luò)訓(xùn)練以及相關(guān)應(yīng)用)
2.3 反饋神經(jīng)網(wǎng)絡(luò)(Hopfield網(wǎng)絡(luò)、玻爾茲曼機(jī)、受限玻爾茲曼機(jī))
3. 深度網(wǎng)絡(luò)常見模型與Keras實(shí)戰(zhàn)(8學(xué)時(shí))
3.1 Keras與殘差網(wǎng)絡(luò)(從LSTM到Highway網(wǎng)絡(luò)、從Highway網(wǎng)絡(luò)到殘差網(wǎng)絡(luò)、基于Highway網(wǎng)絡(luò)的應(yīng)用)
3.2 自動(dòng)編碼機(jī)AE及生成對抗網(wǎng)絡(luò)GAN(AE的起源與變種、生成對抗網(wǎng)絡(luò)GAN、基于GAN網(wǎng)絡(luò)的應(yīng)用)
3.3 基于Keras的行為識(shí)別(行為識(shí)別問題簡介、基于深度學(xué)習(xí)的行為識(shí)別常用模型介紹、基于Keras的行為識(shí)別實(shí)踐)
3.4 基于Keras的場景分割(場景分割問題簡介、基于深度學(xué)習(xí)的場景分割常用模型介紹、基于Keras的場景分割實(shí)踐)
4. 深度學(xué)習(xí)框架(4學(xué)時(shí))
4.1 Caffe入門(簡介、安裝和配置、優(yōu)點(diǎn)與局限性分析、深入Caffe源碼、Caffe調(diào)試)
4.2 Caffe提高(基于Caffe的MINST手寫識(shí)別、Caffe的Python接口、Caffe修改與添加Layer、網(wǎng)絡(luò)訓(xùn)練技巧)
講師團(tuán)隊(duì)
汪老師,中科院自動(dòng)化所一線科研學(xué)者,副研究員,在領(lǐng)域頂級會(huì)議期刊 ICCV、TNNLS、TIP等發(fā)表論文20多篇;參加全國視頻圖像分析技術(shù)挑戰(zhàn)賽,獲得目標(biāo)檢測識(shí)別第二名,熟練掌握并應(yīng)用深度學(xué)習(xí)Keras框架和Caffe框架。
宮老師,某知名外企研究院算法工程師,中國科學(xué)院自動(dòng)化研究所博士畢業(yè)生,在計(jì)算機(jī)視覺與人工智能領(lǐng)域具有近六年的研究經(jīng)歷。攻讀博士學(xué)位期間主要研究方向是模式識(shí)別與圖像處理,曾在模式識(shí)別領(lǐng)域內(nèi)頂級國際期刊發(fā)表論文,參加某知名互聯(lián)網(wǎng)公司舉辦的圖像分割競賽,獲得第四名的成績。目前主要負(fù)責(zé)計(jì)算機(jī)視覺與人工智能方面的算法研發(fā)工作。
邵老師,現(xiàn)任副教授、碩士生導(dǎo)師,中科院自動(dòng)化所博士畢業(yè),具有兩年教學(xué)授課經(jīng)驗(yàn)。主要研究方向包括機(jī)器學(xué)習(xí)、模式識(shí)別與圖像處理,作為項(xiàng)目負(fù)責(zé)人承擔(dān)國家自然科學(xué)基金,在國際主流期刊和會(huì)議上發(fā)表論文數(shù)篇。
霍老師,一線青年學(xué)者,西安電子科技大學(xué)博士畢業(yè),研究方向?yàn)閳D像處理,主持和參與多項(xiàng)國家自然科學(xué)基金,以第一作者在相關(guān)領(lǐng)域期刊以及會(huì)議上發(fā)表論文多篇。
聯(lián)系客服