国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
所謂的機(jī)器學(xué)習(xí)革命,目前還只是一場(chǎng)進(jìn)化



【AI世代編者按】美國科技博客TechCrunch日前闡述了當(dāng)前機(jī)器學(xué)習(xí)的發(fā)展現(xiàn)狀,由于很多大型科技公司仍在使用傳統(tǒng)技術(shù),而沒有充分利用深度學(xué)習(xí),因此這目前還處于進(jìn)化階段,算不上真正的革命。


以下為AI世代(微信號(hào):tencentai)編譯整理的原文內(nèi)容:


大型科技公司都在積極圍繞人工智能和機(jī)器學(xué)習(xí)進(jìn)行業(yè)務(wù)調(diào)整:谷歌現(xiàn)在的戰(zhàn)略是“AI為先”,Uber也在全面部署機(jī)器學(xué)習(xí),各種各樣的內(nèi)部人工智能實(shí)驗(yàn)室相繼涌現(xiàn)。


他們都在投入大量的資源和精力,希望說服整個(gè)世界相信,機(jī)器學(xué)習(xí)革命已經(jīng)啟幕。他們宣稱深度學(xué)習(xí)是這場(chǎng)革命的關(guān)鍵突破,正是這種技術(shù)支撐了新的無人駕駛汽車、視覺助理和各種各樣的新穎技術(shù)。


盡管這項(xiàng)技術(shù)令人們異常興奮,但從實(shí)踐角度來看,未來化程度卻并不算高。


機(jī)器學(xué)習(xí)領(lǐng)域的軟件工程師和數(shù)據(jù)科學(xué)家目前使用的很多算法和工具與幾年前完全相同。


也就是說,多數(shù)人工智能應(yīng)用使用的仍是傳統(tǒng)機(jī)器學(xué)習(xí)模型,而非深度神經(jīng)網(wǎng)絡(luò)。工程師仍在使用傳統(tǒng)的軟件工程工具來開發(fā)機(jī)器學(xué)習(xí),而且沒有起到效果:將數(shù)據(jù)引入模型并生成結(jié)果的管道其實(shí)是由分散且互不兼容的信息拼湊而成的。然而,隨著大型科技公司平滑這一流程,針對(duì)機(jī)器學(xué)習(xí)構(gòu)建配有端對(duì)端功能的新平臺(tái),變化也悄然而至。


機(jī)器學(xué)習(xí)“三明治”包含什么?


機(jī)器學(xué)習(xí)分成三個(gè)階段——數(shù)據(jù)處理、模型構(gòu)建以及部署和監(jiān)控。中間層就是幫助機(jī)器學(xué)習(xí)利用輸入的數(shù)據(jù)學(xué)會(huì)預(yù)測(cè)的管道。


這種模型也是“深度學(xué)習(xí)”所在的地方。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)算法的一個(gè)子類,可以使用多層神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)輸入和輸出之間的復(fù)雜關(guān)系。神經(jīng)網(wǎng)絡(luò)的層次越多,所能捕捉的復(fù)雜性就越高。


傳統(tǒng)的統(tǒng)計(jì)型機(jī)器學(xué)習(xí)算法(例如不使用深度神經(jīng)網(wǎng)絡(luò)的算法)在捕捉訓(xùn)練數(shù)據(jù)的信息時(shí),能力較為有限。但這些較為基礎(chǔ)的機(jī)器學(xué)習(xí)算法足夠應(yīng)對(duì)很多應(yīng)用,因此把深度學(xué)習(xí)模型的復(fù)雜性增加進(jìn)來往往有些多余。所以,即便我們身處深度學(xué)習(xí)的浪潮之中,仍然可以看到軟件工程師在機(jī)器學(xué)習(xí)工程中廣泛使用這些傳統(tǒng)模型。


但作為這個(gè)三明治流程的“面包”,那些負(fù)責(zé)把一切湊在一起的東西卻是在訓(xùn)練機(jī)器學(xué)習(xí)模型之前和之后發(fā)生的。


第一個(gè)階段需要清理和格式化海量數(shù)據(jù),以供模型使用。最后一個(gè)階段需要仔細(xì)部署和監(jiān)控這個(gè)模型。我們發(fā)現(xiàn),人工智能的多數(shù)工程時(shí)間其實(shí)都沒有花在機(jī)器學(xué)習(xí)模型的開發(fā)階段,而是花在籌備和監(jiān)督這些模型的過程中。



機(jī)器學(xué)習(xí)三明治的“夾心”部分


盡管大型科技公司的人工智能實(shí)驗(yàn)室都在集中精力開發(fā)深度學(xué)習(xí)技術(shù),但這些公司的多數(shù)機(jī)器學(xué)習(xí)應(yīng)用并不依賴神經(jīng)網(wǎng)絡(luò),而是使用傳統(tǒng)機(jī)器學(xué)習(xí)模型。最常見的模型包括線性/邏輯回歸、隨機(jī)預(yù)測(cè)和提升的決策樹。科技公司的許多服務(wù)都使用這種模型,包括好友推薦、廣告定向、用戶興趣預(yù)測(cè)、供需模擬和搜索結(jié)果排序。


工程師用來訓(xùn)練這些模型的一些工具同樣很過時(shí)。作為最常用的機(jī)器學(xué)習(xí)庫中的一個(gè),scikit-learn是在10年前發(fā)布的。


完全有理由使用這些更簡單的模型,而不使用深度學(xué)習(xí)模型。深度神經(jīng)網(wǎng)絡(luò)很難訓(xùn)練,需要耗費(fèi)更多時(shí)間和計(jì)算資源(往往還需要不同的硬件,也就是GPU)。想讓深度學(xué)習(xí)真正起作用并非易事——目前仍然需要借助繁雜的人工程序,這既需要直覺,還要不斷試錯(cuò)。


借助傳統(tǒng)機(jī)器學(xué)習(xí)模型,工程師用在模型訓(xùn)練和調(diào)節(jié)上的時(shí)間相對(duì)較短——通常只要幾個(gè)小時(shí)。歸根到底,如果深度學(xué)習(xí)所能帶來的精確度提升不太明顯,那應(yīng)該更加重視可擴(kuò)展性和開發(fā)速度。



融合一切——從數(shù)據(jù)到部署過程中使用的工具


所以,具體到機(jī)器學(xué)習(xí)模型的訓(xùn)練過程,傳統(tǒng)方法效果也不錯(cuò)。但這種方式卻無法應(yīng)用到那些將機(jī)器學(xué)習(xí)管道結(jié)合起來的基礎(chǔ)設(shè)施。使用這些傳統(tǒng)的機(jī)器學(xué)習(xí)軟件工程工具可能提高錯(cuò)誤率。


作為機(jī)器學(xué)習(xí)管道的第一階段,數(shù)據(jù)收集和處理階段就凸顯出這一點(diǎn)。雖然大公司顯然擁有海量數(shù)據(jù),但數(shù)據(jù)科學(xué)家或工程師卻必須清理數(shù)據(jù)才能使之發(fā)揮作用——包括查證和合并不同來源的重復(fù)內(nèi)容,對(duì)指標(biāo)進(jìn)行標(biāo)準(zhǔn)化處理,設(shè)計(jì)和認(rèn)證各種功能。


在多數(shù)公司,工程師都要把SQL和Hive請(qǐng)求結(jié)合起來,還要用Python腳本來聚合和格式化一個(gè)或多個(gè)數(shù)據(jù)來源的數(shù)百萬數(shù)據(jù)點(diǎn)。這通常需要通過人工來處理,往往要耗費(fèi)數(shù)天時(shí)間。其中一些可能是重復(fù)性工作,因?yàn)楹芏喙镜牧鞒潭际欠稚㈤_來的——數(shù)據(jù)科學(xué)家或工程師往往會(huì)使用離線腳本或Jupyter Notebooks來處理數(shù)據(jù)。


另外,科技公司的龐大規(guī)模混合了各種錯(cuò)誤,因此要在生產(chǎn)過程中仔細(xì)部署和監(jiān)控模型是不切實(shí)際的。


然而,作為傳統(tǒng)軟件測(cè)試的支柱,傳統(tǒng)的單元測(cè)試其實(shí)并不適用于機(jī)器學(xué)習(xí)模型,因?yàn)闄C(jī)器學(xué)習(xí)模型的正確輸出無法事先知曉。畢竟,機(jī)器學(xué)習(xí)的目的是讓模型學(xué)會(huì)利用數(shù)據(jù)預(yù)測(cè),而不需要借助工程師通過代碼給出的明確指令。所以,工程師放棄了單元測(cè)試,而是采用了結(jié)構(gòu)化程度更低的方法:他們手動(dòng)監(jiān)控控制面板,并為新的模型編寫警報(bào)。


真實(shí)數(shù)據(jù)的變化也可能導(dǎo)致受過訓(xùn)練的模型準(zhǔn)確性降低,所以工程師每天或每個(gè)月都要用新的數(shù)據(jù)對(duì)生產(chǎn)模型進(jìn)行重新訓(xùn)練,具體要取決于應(yīng)用模式。但現(xiàn)有工程基礎(chǔ)架構(gòu)里面缺乏對(duì)機(jī)器學(xué)習(xí)的明確支持,可能導(dǎo)致開發(fā)中的模型和生產(chǎn)中的模型發(fā)生脫節(jié)——常規(guī)代碼的更新頻率大大降低。


很多工程師仍然借助基本的方法將模型部署到生產(chǎn)中,例如保存一個(gè)受過訓(xùn)練的模型的序列化版本,或者將權(quán)重因素應(yīng)用到文件之中。工程師有時(shí)候需要用不同的語言或框架重建模型原型以及數(shù)據(jù)管道的各個(gè)部分,從而從事生產(chǎn)基礎(chǔ)設(shè)施的開發(fā)。但凡與機(jī)器學(xué)習(xí)開發(fā)流程的任何一個(gè)階段不兼容,都會(huì)產(chǎn)生錯(cuò)誤。



未來展望


為了解決這些問題,有幾家擁有足夠資源開發(fā)定制工具的大公司,已經(jīng)投入了時(shí)間和技術(shù)來制作自己的機(jī)器學(xué)習(xí)專用工具。他們的目標(biāo)是開發(fā)端對(duì)端無縫機(jī)器學(xué)習(xí)平臺(tái),從而兼容他們自己的工程基礎(chǔ)設(shè)施。


Facebook的FBLearner Flow和Uber的Michelangelo都是這樣的內(nèi)部機(jī)器學(xué)習(xí)平臺(tái)。有了這樣的平臺(tái),工程師就可以用直觀的用戶界面構(gòu)建訓(xùn)練和驗(yàn)證數(shù)據(jù)集,把花在這個(gè)階段的時(shí)間從幾天縮短到幾小時(shí)。之后,工程師還能通過點(diǎn)擊按鈕來訓(xùn)練模型。最終,他們還能輕而易舉地監(jiān)控和直接更新生產(chǎn)模型。


Azure機(jī)器學(xué)習(xí)和亞馬遜機(jī)器學(xué)習(xí)等服務(wù)都是一些公開選擇,可以提供類似的端對(duì)端平臺(tái)功能,但只能與其他的微軟或亞馬遜服務(wù)整合,用于存儲(chǔ)數(shù)據(jù)和管道的部署組件。


盡管這些科技巨頭都在利用機(jī)器學(xué)習(xí)改進(jìn)自家產(chǎn)品,但多數(shù)公司仍要面臨重大挑戰(zhàn),流程中也存在效率低下的現(xiàn)象。他們?nèi)栽谑褂脗鹘y(tǒng)機(jī)器學(xué)習(xí)模型,而非更加先進(jìn)的深度學(xué)習(xí),而且仍在依靠不太適合機(jī)器學(xué)習(xí)使用的傳統(tǒng)工具基礎(chǔ)設(shè)施。


幸運(yùn)的是,隨著這些公司逐漸關(guān)注人工智能,他們都在投資開發(fā)專有工具,以便改善機(jī)器學(xué)習(xí)的效果。借助這些內(nèi)部工具,或者能夠與其現(xiàn)有基礎(chǔ)設(shè)施緊密整合的第三方機(jī)器學(xué)習(xí)平臺(tái),這些組織便可實(shí)現(xiàn)人工智能的潛力。(編譯/長歌)

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
算法工程師的危機(jī)
《AI 算法工程師手冊(cè)》
什么是人工智能(AI)?—— 你需要知道的三件事
從蘋果店員到機(jī)器學(xué)習(xí)工程師:學(xué)習(xí)AI,我是這樣起步的
【人工智能工程師】掌握這10個(gè)項(xiàng)目,秒殺90%面試者!
2 個(gè)月從零開始入門 AI ,我是如何做到的?
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服