江疏影不雅视频在线播放,美女胸被狂揉扒开吃奶动漫视频

被AI顛覆的用戶體驗，到底有多爽？

汕頭能率 >《互聯(lián)時代》

2020.01.16

關(guān)注

AI時代智能硬件的趨勢是什么？

語言AI為什么極其重要？

大家早上好！我們一直在做的事情，是讓表達與獲取信息變得更簡單，而表達和獲取這兩件事都起源于語言，代表著語言的輸入與輸出。所以，我今天的分享，將沿著語言的輸入與輸出這兩條正在無限延伸的線展開。

一、AI驅(qū)動硬件，顛覆用戶體驗

1.AI錄音筆

雖然說錄音筆是個小眾市場，但有了人工智能的加持，錄音筆變成了電商爆款。

我們今年出品了一款人工智能的加持的AI錄音筆，它在雙十一多個主流電商平臺上取得了單品銷量第一的成績，同時復購率還很高。

相對傳統(tǒng)錄音筆來說，我們的AI錄音筆不僅有雙麥克風陣列，同時還有AI降噪、實時轉(zhuǎn)寫文字、云端存儲和搜索、智能編輯、同聲傳譯等功能。

這款產(chǎn)品上線后，整個市場都改變了，索尼、愛國者、紐曼都加入進來，成立了一個聯(lián)盟，而搜狗成了盟主。

根據(jù)我們的調(diào)查，我們的AI錄音筆上線之前，整個錄音筆市場銷量是逐年下滑的，市場保有量只有400萬支。

從3月份我們上線第一代產(chǎn)品開始，主流電商平臺的錄音筆搜索量開始上升，到12月份我們發(fā)布了第二代產(chǎn)品，開始一點點變硬，就像之前手機從功能機走向智能機一樣。而且，加上AI能力的注入，帶來的注定是顛覆式的體驗。

2.AI時代個人硬件的趨勢

有了AI的注入，C端消費品也發(fā)生了變化，這個變化主要有兩大趨勢。

① 變得更加便攜

以前放在桌上的PC機很大，隨后智能硬件開始走向筆記本、iPad、手機，甚至開始走向可穿戴，因此未來個人硬件的趨勢是越來越移動化、便攜化。

② 擁有更強的IO能力

從以前的計算能力走向傳感器能力，并且基于AI的處理能力，將從人去適應機器，變成機器適應人，最終機器接管人的感官，成為人的助理。

AI對硬件會產(chǎn)生什么影響呢？對于未來10年路徑，我的暢想是智能硬件從手機走向手表、耳機，到未來走向眼鏡，這可能會逐漸改變我們以手機為中心的使用方式，比如眼鏡和耳機會取代手機作為我們接觸外界信息的通道。

硬件背后，是人去感知這個世界。

除了有圖像和聲音之外，很重要的就是語言，它是我們與世界交互的一種抽象方式。而且，只有人類能夠處理語言。

亞里士多德曾講到，“語言是心靈印象的符號，是人類思維的工具，是知識的載體。有了語言，人類社會才能溝通交流。不管是我們生產(chǎn)的語言，還是計算機處理的語言，語言都是最難的一件事情，是人工智能皇冠上的明珠?！?/p>

圖靈測試中提到，機器能夠用語言與人交流，就代表它擁有智能。

今天我們的人工智能還不具有創(chuàng)造力和通用的推理能力，但是可以做這樣一個猜想：

只有當機器掌握了語言之后，它才能夠完整地擁有創(chuàng)造力和推理能力。

不會講話的機器，你會認為它智能嗎？當然不會。因此，語言在智能當中極其重要，這也是人與動物的重大區(qū)別。

二、語言AI的發(fā)展趨勢

我們會看到，以語言為核心變成了人工智能發(fā)展路徑的關(guān)鍵節(jié)點。我們做輸入法、做搜索，其實都是在處理語言，都是為了幫大家更好地表達、更好地獲取信息。

1.語言的自然交互和認知問題

關(guān)于語言，我有兩部分內(nèi)容要分享給大家：

第一，自然交互。

自然交互讓人跟機器之間能夠用語音、圖像、手勢等各種方式產(chǎn)生交流，其中用到了語音、圖像技術(shù)，也包括視覺技術(shù)。

第二，認知問題，我們叫做知識計算。

基于語言，機器能夠進行問答和對話，機器翻譯是認知技術(shù)入門的門檻。有了更好的感知技術(shù)，機器會從手機走向新的智能硬件；有了更好的認知技術(shù)，機器對知識會產(chǎn)生理解和推理，尤其是在垂直領(lǐng)域擁有問答的能力。

智能硬件新的硬件形式與新的對話和問答能力，未來會走向智能助理，這也是整個AI行業(yè)在產(chǎn)品層面上最明珠的地方。

蘋果大概在2006年就開始推出智能助理，到今天Google、百度、阿里、小米做這樣的音箱產(chǎn)品，核心都是在做智能助理。但是從外殼上來說，我認為并不是最好的方向。

布局時，語音、圖像都有大量的技術(shù)要去做，包括語音識別、語音合成、語音變聲，包括搜索獨有的辨別能力。

其中，語音識別是自然交互中最自然的事情。搜狗輸入法，今天我們做到了每天超過8億次的使用量，而且這個數(shù)字上升很快。春節(jié)期間，可能就會超過9-10億次的日請求量。我們也積累了大量的數(shù)據(jù)，包括了語種、方言等各種能力。

在知識計算之后，我們強調(diào)一個核心觀點，就是機器做閱讀理解之后做問答，傳統(tǒng)的搜索是通過關(guān)鍵詞給你10條鏈接，隨著技術(shù)的進步，我們整個處理能力會從詞變成句子、段落、篇章，用戶的表達也可能會轉(zhuǎn)換成句子，機器的閱讀理解也會走向篇章和整個文章體系，這是技術(shù)進步帶來的機會。

2.語音識別

語言識別聽著好像是一件很簡單的事情，但其實并不是純粹的單點技術(shù)，在識別過程當中，對于語音、語義的理解還有一些點需要攻克。

首先，人聲分離，如果是兩個人在對話，機器要能識別不同的人，能動態(tài)地去判斷是第一個人還是第二個人。

其次，機器要能夠識別掌聲、笑聲或其它聲音，幫助我們理解內(nèi)容。

最后，中英文混合是非常難的事情，從傳統(tǒng)的深度學習網(wǎng)絡(luò)數(shù)據(jù)中得不到一個混合的模型，所以要在機器中加入一些特定知識，來改變這個系統(tǒng)。

在這個識別背后，還會有更復雜的技術(shù)需要我們解決。比如我們做錄音筆時會考慮很多問題，其中一個就是如何讓機器在嘈雜的環(huán)境里聽清人的聲音，幫助后面進行識別，這也是我們最前沿的技術(shù)。

傳統(tǒng)的硬件是用麥克風矩陣實現(xiàn)的，用多個麥克風進行中間的數(shù)字計算、信號處理。今天依靠人工智能，我們有了新的方法，我們的工程師在現(xiàn)實場景中對4萬種噪音進行了學習，使得機器有能力分辨噪音。

原始的機器識別、處理是不夠的。為了讓錄音筆與聲音的交互更好，我們有了新的算法，降噪技術(shù)在實驗中已經(jīng)完成了，未來的新款錄音筆會給大家?guī)順O致的AI體驗。

從語音識別里面，除了語音識別外，我們往前做了很多前沿的事情，比如語音的合成，它可以惟妙惟肖地用人的音色進行表達。

3.語音合成

做技術(shù)的人都知道，以今天的AI能力，機器不會有非常精準的認知理解，大家聽到的可能還是轉(zhuǎn)述師那種毫無情感的聲音，為了讓合成的聲音更加具有感情、更加像本人真實聲音，我們使用了一種新技術(shù)：聲音皮膚。在技術(shù)上，我們稱之為特征的提取能力。

比如，大家在得到聽梁寧的課程，其實就是讓另外一個人讀一篇文章，再把聲音皮膚附到這個聲音里面來，使得合成的聲音可以表達他的情感，經(jīng)過合成之后，最后由梁寧來呈現(xiàn)。

這種做法能改善整個音頻節(jié)目的生產(chǎn)環(huán)節(jié)，表演者和生產(chǎn)者做到一定的分離，避免因為人員離職、生病等帶來的各種不確定因素。

這種情況下，使得我們每個人在互聯(lián)網(wǎng)上不僅可以換成其它形象，也可以換成自己想要的任何一個聲音形象。

在生活中也有實際用處，年底馬上要開年會了，如果你要表演唱歌，但是五音不全怎么辦呢？可以把你的聲音特征做一次提取，然后放到《藍精靈》歌里，會比你自己唱得好聽。

這樣一些技術(shù)，使得在交互中間能夠做到人機結(jié)合，使得制作能力能夠放大。

4.從語音變聲到視頻合成

當然，除了聲音的識別、合成、遷移以外，我們也做了一些更前沿的工作，即從語音走向了視覺，從語音變聲走向視頻合成。這就不得不提搜狗的分身，這是我們產(chǎn)品上一個重大的進展。

搜狗分身發(fā)展到現(xiàn)在經(jīng)歷了多次技術(shù)迭代，從最早給新華社做主持人，到給央視做主持人，再到第二代能夠讓它更豐富地表達；

第三代，能夠站起來有手勢；

到第四代之后就開始做到了多語言、多場景的播報能力；

到了第五代之后開始能夠做交互，比如平安普惠的保險項目，服務人員已經(jīng)被機器取代了，實際你在保險簽約的時候，是機器人跟你做交互回答。

我們將很快發(fā)布第六代產(chǎn)品，它將擁有大角度、大幅度的動作能力。

這樣的技術(shù)是機器在取代人上面的一次重大應用。所以，這里面我們可以看到，以語言為核心，背后配上語音、人的表情、肢體、唇語，是能夠使得人機交互實現(xiàn)更自然的狀態(tài)的。

在未來，也許不到10年時間，我們將會構(gòu)建這樣一條路徑：自然交互會從文字走向語音、圖像理解，大家看到的錄音筆、同傳、合成主播等，其實是在語音圖像的交互能力里面做增強，背后還是語言。

另外一條道路就是認知能力不斷提升，使得從搜索走向、輔助醫(yī)療、輔助問答以及合并語音圖像技術(shù)，最終走向行業(yè)終極的理想，就是每個人都擁有一個個人助理。

在一些垂直領(lǐng)域當中，能夠幫你去做秘書的工作，或者是成為你的分身，跟世界進行溝通。

我們也會持續(xù)布局語言AI下的產(chǎn)品，為大家呈現(xiàn)顛覆體驗的個人助理，用機器幫助每一個人，讓表達、獲取信息更加簡單。謝謝！

*文章為作者獨立觀點，不代表筆記俠立場。

本站僅提供存儲服務，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點擊舉報。

打開APP，閱讀全文并永久保存查看更多類似文章

全球首款同傳翻譯筆京東515開賣預約已破11萬

投喂4萬種噪聲，20種語言方言實時轉(zhuǎn)錄，搜狗「開掛」錄音筆這樣煉成

0.5秒閃譯，12倍速轉(zhuǎn)寫，科大訊飛一口氣發(fā)布五款超強AI產(chǎn)品

科大訊飛用AI顛覆錄音筆行業(yè)：實時轉(zhuǎn)寫分場景降噪邊錄邊譯

沒想到這家老牌AI公司越來越不“純粹”了

Sogo inside：搜狗開放聽寫服務成立AI創(chuàng)新聯(lián)盟

更多類似文章 >>

国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看