Google擁有業(yè)界最大的機(jī)器學(xué)習(xí)堆棧之一,目前以其Google Cloud AI和機(jī)器學(xué)習(xí)平臺(tái)為中心。谷歌幾年前將TensorFlow開(kāi)源,但TensorFlow仍然是最成熟且被廣泛引用的深度學(xué)習(xí)框架。同樣,谷歌幾年前將Kubernetes剝離,但它仍然是占主導(dǎo)地位的容器管理系統(tǒng)。
Google是開(kāi)發(fā)人員,數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)專家的最佳工具和基礎(chǔ)設(shè)施來(lái)源之一,但是從歷史上看,對(duì)于缺乏認(rèn)真的數(shù)據(jù)科學(xué)或編程背景的業(yè)務(wù)分析師而言,Google AI的吸引力并不大。
Google Cloud AI和機(jī)器學(xué)習(xí)平臺(tái)包括AI構(gòu)建塊,AI平臺(tái)和加速器以及AI解決方案。人工智能解決方案是相當(dāng)新的,針對(duì)的是業(yè)務(wù)經(jīng)理,而不是數(shù)據(jù)科學(xué)家。其中可能包括來(lái)自Google或其合作伙伴的咨詢。
經(jīng)過(guò)預(yù)先訓(xùn)練但可自定義的AI構(gòu)建塊可以在不熟悉編程或數(shù)據(jù)科學(xué)的情況下使用。盡管如此,出于實(shí)用性的考慮,熟練的數(shù)據(jù)科學(xué)家經(jīng)常使用它們,從根本上講,無(wú)需大量的模型培訓(xùn)即可完成工作。
AI平臺(tái)和加速器通常面向認(rèn)真的數(shù)據(jù)科學(xué)家,需要編碼技能,數(shù)據(jù)準(zhǔn)備技術(shù)知識(shí)和大量培訓(xùn)時(shí)間。我建議僅在嘗試了相關(guān)構(gòu)建模塊之后才去那里。
Google Cloud的AI產(chǎn)品中仍然缺少一些鏈接,尤其是在數(shù)據(jù)準(zhǔn)備方面。Google Cloud與數(shù)據(jù)導(dǎo)入和調(diào)節(jié)服務(wù)最接近的是Trifacta的第三方Cloud Dataprep。我在一年前嘗試過(guò),但不知所措。但是,內(nèi)置在Cloud AutoML Tables中的功能工程很有希望,并且對(duì)于其他情況提供這種服務(wù)將很有用。
AI的陰暗面與道德和責(zé)任感(或缺乏道德感)以及持久的模型偏差(通常是由于用于訓(xùn)練的數(shù)據(jù)偏差)有關(guān)。Google于2018年發(fā)布了AI原則。這項(xiàng)工作仍在進(jìn)行中,但這是指導(dǎo)的基礎(chǔ),最近在有關(guān)責(zé)任AI的博客文章中對(duì)此進(jìn)行了討論。
AI市場(chǎng)上有很多競(jìng)爭(zhēng),而公共云市場(chǎng)上有很多競(jìng)爭(zhēng)(超過(guò)六個(gè)可靠的供應(yīng)商)。為了公平地進(jìn)行比較,我必須寫(xiě)一篇文章的時(shí)間至少是此文章的五倍,所以我討厭把它們排除在外,因此我不得不省略大多數(shù)產(chǎn)品比較。對(duì)于最明顯的比較,可以總結(jié)一下:AWS可以完成Google的大部分工作,并且也非常出色,但是通常收取更高的價(jià)格。
Google Cloud的AI構(gòu)建塊不需要太多的機(jī)器學(xué)習(xí)專業(yè)知識(shí),而是建立在預(yù)先訓(xùn)練的模型和自動(dòng)訓(xùn)練的基礎(chǔ)上。AI平臺(tái)可讓您訓(xùn)練和部署自己的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型。
Google Cloud AI Building Blocks是易于使用的組件,您可以將其合并到自己的應(yīng)用程序中以添加視覺(jué),語(yǔ)言,對(duì)話和結(jié)構(gòu)化數(shù)據(jù)。許多AI構(gòu)件都是經(jīng)過(guò)預(yù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò),但是如果它們不能滿足您的需求,則可以使用傳遞學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)搜索進(jìn)行自定義。AutoML Tables有所不同,因?yàn)樗梢宰詣?dòng)化數(shù)據(jù)科學(xué)家用來(lái)為表格數(shù)據(jù)集找到最佳機(jī)器學(xué)習(xí)模型的過(guò)程。
Google Cloud AutoML服務(wù)為語(yǔ)言對(duì)翻譯,文本分類,對(duì)象檢測(cè),圖像分類以及視頻對(duì)象分類和跟蹤提供了定制的深度神經(jīng)網(wǎng)絡(luò)。他們需要標(biāo)記數(shù)據(jù)進(jìn)行培訓(xùn),但不需要大量的深度學(xué)習(xí),遷移學(xué)習(xí)或編程知識(shí)。
Google Cloud AutoML可為您的標(biāo)記數(shù)據(jù)自定義經(jīng)過(guò)谷歌測(cè)試,高精度的深度神經(jīng)網(wǎng)絡(luò)。從數(shù)據(jù)訓(xùn)練模型時(shí),AutoML并非從頭開(kāi)始,而是實(shí)現(xiàn)了自動(dòng)深度傳輸學(xué)習(xí)(意味著它從對(duì)其他數(shù)據(jù)進(jìn)行訓(xùn)練的現(xiàn)有深度神經(jīng)網(wǎng)絡(luò)開(kāi)始)和神經(jīng)體系結(jié)構(gòu)搜索(意味著它找到了額外的網(wǎng)絡(luò)層的正確組合) )進(jìn)行語(yǔ)言對(duì)翻譯和上面列出的其他服務(wù)。
在每個(gè)領(lǐng)域,谷歌已經(jīng)有一個(gè)或多個(gè)基于深度神經(jīng)網(wǎng)絡(luò)和大量標(biāo)記數(shù)據(jù)的預(yù)訓(xùn)練服務(wù)。對(duì)于未修改的數(shù)據(jù),這些方法很可能會(huì)起作用,因此您應(yīng)該對(duì)其進(jìn)行測(cè)試以節(jié)省時(shí)間和金錢。如果他們沒(méi)有做您需要的事情,Google Cloud AutoML可以幫助您創(chuàng)建一個(gè)可以做的模型,而無(wú)需您知道如何執(zhí)行轉(zhuǎn)移學(xué)習(xí)或如何設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)。
與從頭開(kāi)始訓(xùn)練神經(jīng)網(wǎng)絡(luò)相比,轉(zhuǎn)移學(xué)習(xí)具有兩個(gè)主要優(yōu)點(diǎn)。首先,由于網(wǎng)絡(luò)的大多數(shù)層都已經(jīng)過(guò)良好的訓(xùn)練,因此需要較少的數(shù)據(jù)進(jìn)行訓(xùn)練。其次,由于只優(yōu)化了最后一層,因此訓(xùn)練速度更快。
雖然過(guò)去通常將Google Cloud AutoML服務(wù)打包在一起提供,但現(xiàn)在列出了這些服務(wù)及其基本的經(jīng)過(guò)預(yù)先培訓(xùn)的服務(wù)。其他大多數(shù)公司所說(shuō)的AutoML是由Google Cloud AutoML Tables執(zhí)行的。
對(duì)于許多回歸和分類問(wèn)題,通常的數(shù)據(jù)科學(xué)過(guò)程是創(chuàng)建數(shù)據(jù)表以進(jìn)行訓(xùn)練,清理和整理數(shù)據(jù),執(zhí)行特征工程,并嘗試在轉(zhuǎn)換后的表上訓(xùn)練所有適當(dāng)?shù)哪P?,包括進(jìn)行優(yōu)化的步驟最佳模型的超參數(shù)。手動(dòng)識(shí)別目標(biāo)字段后,Google Cloud AutoML Tables可以自動(dòng)執(zhí)行整個(gè)過(guò)程。
AutoML Tables會(huì)自動(dòng)在Google的模型動(dòng)物園中搜索結(jié)構(gòu)化數(shù)據(jù),以找到最適合您的模型,從線性/邏輯回歸模型(用于簡(jiǎn)化數(shù)據(jù)集)到高級(jí)的深度,集成和體系結(jié)構(gòu)搜索方法(用于更大型,更復(fù)雜的模型)不等。它可以自動(dòng)執(zhí)行各種表格數(shù)據(jù)原語(yǔ)(例如數(shù)字,類,字符串,時(shí)間戳和列表)上的特征工程,并幫助您檢測(cè)和處理缺失值,異常值和其他常見(jiàn)數(shù)據(jù)問(wèn)題。
其無(wú)代碼界面可指導(dǎo)您完成整個(gè)端到端機(jī)器學(xué)習(xí)生命周期,使團(tuán)隊(duì)中的任何人都可以輕松構(gòu)建模型并將其可靠地集成到更廣泛的應(yīng)用程序中。AutoML表提供了廣泛的輸入數(shù)據(jù)和模型行為可解釋性功能,以及用于防止常見(jiàn)錯(cuò)誤的護(hù)欄。在API和筆記本環(huán)境中也可以使用AutoML表。
聯(lián)系客服