国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
走訪阿里達(dá)摩院:用機(jī)器視覺做廣告設(shè)計(jì) 用機(jī)器翻譯推動國際電商

智東西(公眾號:zhidxcom)

文 | 寓揚(yáng)

去年十月份,馬云成立阿里巴巴達(dá)摩院,三年拿出1000億布局前沿技術(shù)的研究,并對它提出三個(gè)要求,“活得要比阿里巴巴長”、“服務(wù)全世界至少20億人口”、“面向未來用科技解決未來的問題”。

在過去的9個(gè)月中,阿里達(dá)摩院也陸續(xù)傳出來自各方的技術(shù)大牛加盟;公布了正在研發(fā)中的AI芯片Ali-NPU;研發(fā)出量子電路模擬器“太章”,率先實(shí)現(xiàn)81量子比特(40層)的模擬;應(yīng)用在上海地鐵站的語音購票等消息,但整個(gè)達(dá)摩院(正如其名)還隱匿在云霧中。

阿里達(dá)摩院第一次公開對外,則是近期在杭州舉辦的一場技術(shù)分享活動,現(xiàn)場達(dá)摩院來自不同部門的四位專家學(xué)者分享了他們的研究成果以及落地應(yīng)用,智東西也作為首批媒體受邀參與其中。

可以看到,在達(dá)摩院的技術(shù)布局中,既有應(yīng)用于當(dāng)下的語音識別、機(jī)器視覺、機(jī)器翻譯等技術(shù),也有量子計(jì)算等中長期布局未來的技術(shù)。而在應(yīng)用場景中,達(dá)摩院的技術(shù)也廣泛的落地在阿里的業(yè)務(wù)之上,去解決實(shí)際問題,比如機(jī)器翻譯用于阿里的國際貿(mào)易,視覺生成用于淘寶廣告的自動生成等。

一、圍繞人、物、空間 推動機(jī)器視覺落地

阿里達(dá)摩院機(jī)器智能技術(shù)實(shí)驗(yàn)室資深算法專家謝宣松分享了計(jì)算機(jī)視覺在產(chǎn)業(yè)中的應(yīng)用,主要圍繞人(醫(yī)療視覺)、物(行業(yè)視覺)、空間(城市大腦)、設(shè)計(jì)(視覺生成)幾個(gè)維度來展開。謝宣松談到,圍繞人、物、空間來做一些機(jī)器視覺,目的是協(xié)助人提高效率。

相比城市大腦和醫(yī)療視覺,如何將AI技術(shù)落地場景眾多、問題更加復(fù)雜的產(chǎn)業(yè),以及視覺生成技術(shù)如何提高人類效率,更加吸引智東西的關(guān)注。

行業(yè)視覺是產(chǎn)業(yè)落地的一個(gè)大領(lǐng)域,場景眾多,哪些場景能夠讓技術(shù)落地呢?謝宣松指出3種機(jī)器視覺可以落地的條件:

第一種是診斷內(nèi)容肉眼可分辨,正常&故障樣本充足,對漏報(bào)有一定的容忍度。這種場景就很適合機(jī)器來做,比如對鐵路螺母是否松動的監(jiān)測。第二種是人肉眼難以發(fā)現(xiàn),可根據(jù)情況用機(jī)器視覺作為代替。第三種是故障樣本極少,但造成事故的結(jié)果又很嚴(yán)重,這時(shí)可以用機(jī)器視覺輔助人工檢測。

限定了邊界后,就可以尋找技術(shù)落地的場景了,比如阿里基于視頻分析,可以自動進(jìn)行鋼圈安全監(jiān)測,實(shí)測精度在95%以上;再比如通過目標(biāo)檢測和行為分析,對豬的疫情等進(jìn)行預(yù)警,前一段阿里云用AI養(yǎng)豬種瓜,也是風(fēng)靡互聯(lián)網(wǎng)圈。

通過行業(yè)場景的落地,謝宣松總結(jié)到,我們需要深入行業(yè),花大力氣明確需求、定義問題;要重視數(shù)據(jù),分析各個(gè)場景下數(shù)據(jù)的特點(diǎn);要簡化問題,優(yōu)先采用簡單有效的方案;并且要長期投入,不斷迭代優(yōu)化方案。

視覺生成即通過AI技術(shù),結(jié)合用戶、場景需求,生成圖像、視頻等內(nèi)容,比如廣告圖像的生成與設(shè)計(jì),廣告視頻的生成,游戲圖像生成等,從而提高人類工作的效率。

阿里是以電商起家的,廣告需求廣泛存在于淘寶商戶中,尤其是雙十一這樣的購物節(jié)設(shè)計(jì)需求大量存在。阿里特意構(gòu)建了設(shè)計(jì)知識圖譜,通過視覺生成來生成廣告效果圖。

其中最典型的應(yīng)用就是魯班系統(tǒng)在淘寶中的應(yīng)用。謝宣松談到,雙十一天貓、淘寶上大量的banner圖片,其中很大一部分都是系統(tǒng)自動自動生成的。比如去年雙十一用AI產(chǎn)圖2.5億張,累計(jì)產(chǎn)圖10億張。身為設(shè)計(jì)師的你看到這一結(jié)果是否會亞歷山大呢?

出了圖片的生成,謝宣松表示,視頻和圖形的內(nèi)容自動/半自動生成是一個(gè)趨勢,也是另一個(gè)藍(lán)海。比如在一個(gè)電視劇場景中,AI可以識別視頻場景中的人物、對話、動作等,在識別場景后,就可以在適當(dāng)?shù)奈恢貌迦胂嚓P(guān)對象。

現(xiàn)場他展示了一張“天貓國際”的植入廣告,以及淘寶商品的視頻生成,當(dāng)然廣告只是應(yīng)用之一,只不過電商平臺需求量太大。

謝宣松還告訴智東西,視覺生成的實(shí)現(xiàn)是各種技術(shù)的綜合應(yīng)用,會借用最基礎(chǔ)的識別分類能力,也會用到序列,同樣它會用到強(qiáng)化技術(shù)的能力,在象素生成和元素豐富上用一些概念能力,最后對整個(gè)系統(tǒng)有檢測過程,使它滿足用戶需求。

二、量子計(jì)算 中長期的布局

時(shí)下火熱的一個(gè)概念就是量子計(jì)算,因?yàn)榱孔佑?jì)算機(jī)一旦取得突破,在算力上就會遠(yuǎn)遠(yuǎn)高于經(jīng)典計(jì)算機(jī),從而帶來算力革命,但這一現(xiàn)象短期內(nèi)很難發(fā)生。

正如阿里達(dá)摩院量子實(shí)驗(yàn)室的量子科學(xué)家徐華所言,通用量子計(jì)算機(jī)發(fā)展前路漫漫,近期我們期待可以解決特定問題的量子芯片,以及針對量子系統(tǒng)進(jìn)行模擬的量子芯片。

量子計(jì)算數(shù)據(jù)阿里中長期局部的一項(xiàng)重要技術(shù),由于量子計(jì)算過于晦澀難懂,這次分享更多的在于科普,我們可以對幾個(gè)常見的概念做一個(gè)解釋:

量子計(jì)算,它是基于量子力學(xué)的基本原理(核心是量子疊加+量子糾纏),利用量子邏輯實(shí)現(xiàn)信息處理的計(jì)算技術(shù),對應(yīng)的機(jī)器就是量子計(jì)算機(jī)。

量子糾纏,對于一對或一群粒子而言,部分粒子的量子狀態(tài)以來其他粒子的狀態(tài),而不能獨(dú)立的表述,則認(rèn)為這一對或一群粒子處于量子糾纏。量子通信主要應(yīng)用的就是量子糾纏,近期中國科大也宣稱率先實(shí)現(xiàn)了18量子比特糾纏。

量子霸權(quán),這是一個(gè)經(jīng)常被提及的概念,它是指對于某個(gè)特定的問題,量子計(jì)算機(jī)可以解決,但是經(jīng)典計(jì)算機(jī)無法解決。2016年Google團(tuán)隊(duì)在理論上提出,49個(gè)物理量子比特可以在隨機(jī)量子電路的輸出采樣這個(gè)特殊問題上實(shí)現(xiàn)量子霸權(quán)。

今年3月份,谷歌提出72個(gè)比特的芯片方案。而后5月份,阿里量子實(shí)驗(yàn)室團(tuán)隊(duì)基于阿里的計(jì)算能力,實(shí)現(xiàn)了81量子比特的模擬。但徐華總結(jié)到,目前的量子霸權(quán)象征意義大于實(shí)際意義,因?yàn)楸旧斫鉀Q不是通用計(jì)算問題,只能算是技術(shù)發(fā)展過程當(dāng)中的一個(gè)個(gè)里程碑。

阿里量子計(jì)算的研究方向涉及物理層、系統(tǒng)層、應(yīng)用層,希望提供全棧能力的解決方案,為客戶提供量子計(jì)算能力。

其中今年上半年推出的“太章”模擬器便是量子實(shí)驗(yàn)室的一個(gè)代表項(xiàng)目。它是一個(gè)量子電路的經(jīng)典模擬器,通過對模擬任務(wù)進(jìn)行有效的分解,利用阿里強(qiáng)大的計(jì)算平臺,完成了之前超級計(jì)算機(jī)上做不到的模擬量子計(jì)算的任務(wù),實(shí)現(xiàn)了對Google計(jì)劃取得 “量子霸權(quán)”硬件的模擬。

但現(xiàn)場徐華也講到,量子模擬器終歸受計(jì)算力所限。量子模擬需要繼續(xù)投入,幫助量子電路設(shè)計(jì)以及量子算法研究,但是從更長遠(yuǎn)的研究來看,幾百個(gè)量子比特超級計(jì)算機(jī)是不能夠模擬的。

近期中國科大宣稱率先取得了18量子比特糾纏,智東西也就該成果的實(shí)質(zhì)性意義與徐華溝通,他表示多個(gè)量子比特的糾纏是非常有意義的,量子糾纏有一個(gè)置信度,置信度是99%與99.99%差別非常大,如果置信度都很高,達(dá)到了99.99%以上,這就與實(shí)現(xiàn)邏輯比特比較接近了。比如50個(gè)邏輯比特組合起來,其算力基本可以達(dá)到現(xiàn)在超級計(jì)算機(jī)的計(jì)算水平。

三、機(jī)器翻譯 阿里國際化的生命線

機(jī)器翻譯是利用計(jì)算機(jī)將一種自然語言專為為另一轉(zhuǎn)自然語言的過程。這項(xiàng)技術(shù)已經(jīng)有60年的歷史,但在最近30年才可以使用。

阿里達(dá)摩院機(jī)器智能技術(shù)實(shí)驗(yàn)室研究員葛妮瑜分享了他們在機(jī)器翻譯技術(shù)中的探索與應(yīng)用,她將機(jī)器翻譯稱為阿里國際化的生命線,因?yàn)榘⒗飮H電商、即時(shí)通訊(釘釘)、旅游(飛豬)等場景存在大量的翻譯需求。

與谷歌的通用神經(jīng)機(jī)器翻譯不同的是,阿里的機(jī)器翻譯更加聚焦在國際電商、即時(shí)通訊、旅游上,采用神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯(NMT)、統(tǒng)計(jì)機(jī)器翻譯(SMT)等多模型結(jié)合的方式進(jìn)行翻譯,目前已覆蓋21種語言,48個(gè)翻譯方向。

葛妮瑜介紹,目前阿里機(jī)器翻譯服務(wù)100+業(yè)務(wù)場景,日均調(diào)用7.5億次,全年翻譯字符數(shù)超過120萬億,應(yīng)用于電商平臺、物流、支付、云計(jì)算、社交等。

在具體將機(jī)器翻譯落地方面,她講述了小語種機(jī)器翻譯和非標(biāo)準(zhǔn)漢語翻譯的具體案例。

以阿里巴巴國際站為例,30%用戶使用西班牙語、俄語、土耳其語等小語種;2017年前三季度,俄羅斯人在中國購物額占海外網(wǎng)站消費(fèi)總額的52%,同時(shí)全部訂單90%都下給了中國;但大約96%的賣家對小語種無能為力。

阿里為了匹配各個(gè)業(yè)務(wù)場景特點(diǎn),融合多種不同技術(shù),取長補(bǔ)短,進(jìn)行場景翻譯的定制化。具體而言針對小語種進(jìn)行語料抓取,建立電商知識庫,并搭建小語種與漢語之間的雙語平行語料庫,通過人工排序規(guī)則等,進(jìn)行小語種機(jī)器翻譯。

另外一個(gè)就是非標(biāo)準(zhǔn)漢語機(jī)器翻譯的斗爭,淘寶上商家為了最大化搜索效果,會輸入很多詞,但是不成句子,平均標(biāo)題多達(dá)30個(gè)字,不自然無語法,對機(jī)器翻譯很有挑戰(zhàn)。

葛妮瑜團(tuán)隊(duì)結(jié)合用戶搜索和成交產(chǎn)品,通過這些自動產(chǎn)生的大量準(zhǔn)確語料,對商家冗長的標(biāo)題進(jìn)行優(yōu)化簡寫,并通過模型不斷自動優(yōu)化,從而實(shí)現(xiàn)商品信息的翻譯。

此外,她也介紹了圖片翻譯方面的一些探索。傳統(tǒng)的方法直接采用機(jī)器翻譯進(jìn)行字符識別。而阿里第一步先對圖像進(jìn)行識別,獲取內(nèi)容描述后,再進(jìn)行字符識別(OCR),通過OCR+圖像內(nèi)容描述,共同進(jìn)行機(jī)器翻譯,從而提升圖片內(nèi)容的翻譯效果。

四、推行業(yè)語音識別

語音識別是一種常見的將語音轉(zhuǎn)換為文字的技術(shù),目前各家做語音識別的公司都號稱通用語音識別準(zhǔn)確率達(dá)到95%以上,但是在細(xì)分場景、特殊領(lǐng)域中,這一識別率會大大下降。

阿里達(dá)摩院機(jī)器智能技術(shù)實(shí)驗(yàn)室高級算法專家雷鳴分享到,得益于更強(qiáng)大的計(jì)算能力,以及更多更真實(shí)的數(shù)據(jù),語音識別正在快速發(fā)展,并且工業(yè)界正在成為創(chuàng)新的主流。

目前谷歌、微軟、百度等都采用通用識別的技術(shù),與其不同的是,阿里則重點(diǎn)布局了行業(yè)語音識別、IoT語音識別和新零售語音識別。

目前應(yīng)用場景越來越復(fù)雜,對語音識別的要求越來越高,隨著模型越來越復(fù)雜,語音識別的效率越來越低;隨著數(shù)據(jù)體量越來越大,訓(xùn)練時(shí)間越來越長,迭代速度越來越慢;并且模型越來越大,很難直接在IoT端進(jìn)行部署。

阿里針對這一情況,在去年11月上線DFSMN模型,使語音識別的錯(cuò)誤率相比之前模型下降20%,同時(shí)效率提升2倍,可在IoT設(shè)備端應(yīng)用,并在今年6月將這項(xiàng)技術(shù)開源。

在具體應(yīng)用方面,阿里的語音技術(shù)已經(jīng)廣泛應(yīng)用在家庭、車載、公共空間。比如家庭的智能音箱,上汽榮威RX5中的車載語音交互技術(shù)。

而在公共場景中,今年上半年阿里在上海地鐵站推出語音售票機(jī),通過語音與視覺多模態(tài)組合,幫助乘客快速獲取車票。另外一個(gè)案例則是在今年的武漢云棲大會上推出的語音點(diǎn)餐機(jī),通過語音交互的方式高效獲取服務(wù)。

此外,阿里的語音技術(shù)也應(yīng)用到法院庭審中,進(jìn)行庭審信息的速記。據(jù)雷鳴介紹,阿里的智能庭審已經(jīng)覆蓋了近300家法院,6000多個(gè)法庭,并應(yīng)用到杭州互聯(lián)網(wǎng)法院中。

結(jié)語:以解決實(shí)際問題為導(dǎo)向的達(dá)摩院

通過阿里達(dá)摩院四位專家分享和與他們的溝通,我們感受最深的一點(diǎn)就是,達(dá)摩院的科研并非“空中樓閣”,而是切切實(shí)實(shí)的以解決實(shí)際問題為導(dǎo)向,目前其研究成果以逐漸落地阿里各個(gè)業(yè)務(wù)線。

此外,在技術(shù)落地解決實(shí)際問題的過程中,無論是語音識別、機(jī)器翻譯,還是機(jī)器視覺,阿里都在嘗試綜合應(yīng)用多種技術(shù)來解決實(shí)際問題。

比如在于機(jī)器智能技術(shù)實(shí)驗(yàn)室研究員葛妮瑜的溝通中,她也提到,針對自然語言處理(NLP)這個(gè)業(yè)界難題,他們也在結(jié)合漢語的實(shí)際情況,通過偏旁部首的研究來提高語義理解的效果。此外她也談到,用多模態(tài)的方式來研究NLP技術(shù)也是學(xué)界的一個(gè)方向。

本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊舉報(bào)。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
“馬云爸爸”成立快一年的達(dá)摩院,究竟在做什么?
達(dá)摩院這一年:科學(xué)家上山,新技術(shù)下海
“神秘”科研機(jī)構(gòu)達(dá)摩院頂級科學(xué)家金榕,為您深度解密AI
what?馬云要研究人類終級話題了!
前有達(dá)摩院,后有羅漢堂,馬云是真創(chuàng)新還是圓武林夢?
對話鄢志杰:語音行業(yè)十五年老兵的沿途風(fēng)景
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服