国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
圖靈社區(qū) : 閱讀 : Kfir Matza:以色列的動作識別技術(shù)世界領(lǐng)先(圖靈訪談)

[+]查看原圖

Kfir Matza是Onysus公司的CTO,Onysus是一家專業(yè)于計算機視覺技術(shù)的初創(chuàng)公司,該公司已經(jīng)入選GEM(全球創(chuàng)業(yè)周)2014年的總決賽。Kfir于上世紀90年代加入以色列國防部,時任精英科技部隊的高級工程師,退役之后任職于ECI電信。他建立過兩家成功的公司,并參與創(chuàng)建了很多公司,其中包括BCC,這是一家從事高風(fēng)險支付的網(wǎng)絡(luò)安全公司,他曾任研發(fā)總監(jiān)。

問:微軟在骨骼識別技術(shù)上投資巨大,而且他們也擁有海量的樣本庫。你如何收集到足夠的樣本數(shù)據(jù)來和像微軟那樣的大公司競爭?

微軟為游戲開發(fā)者開發(fā)工具,而我們定位在一個非常不同的市場,我們提供不需要編程的解決方案。另外一個很大的不同在于Onysus需要的是3D攝像機,而不僅僅是微軟的Kinect。今天的市場上提供了大量的不同種類的攝像機,這樣巨大的分歧帶來了很多的兼容性問題,每臺攝像機都會提供不同的深度數(shù)據(jù)。而且這些攝像機的使用范圍不一樣,有一些很長,可以捕捉整個身體,有一些很短,只能夠用做捕捉手勢。我們把不同的輸入變成統(tǒng)一的界面,并對不同設(shè)備提供統(tǒng)一的輸出。

問:相對于大公司,你們的競爭優(yōu)勢在哪里?

相比于競爭,我們的關(guān)系更傾向于合作。我們的成功很大程度上要依賴于大公司把深度傳感器成功地推向大眾。大公司花費大量的資源把動作傳感器整合到設(shè)備上,但是如果沒有內(nèi)容,所有這些硬件都毫無用處,就像一個沒有app的智能電話。

而廠商們也明白這一點,這就是我們能和因特爾和三星建立戰(zhàn)略合作伙伴關(guān)系的原因,我們期待更多的科技公司加入我們。因為他們對于讓內(nèi)容制造者“入伙”都有強烈的需求。

問:把單獨攝像機作為輸入設(shè)備曾幾何時被看做是效率很低的方法,但是現(xiàn)在很多公司都在嘗試基于軟件的動作識別技術(shù)。你認為這會是未來的趨勢嗎?這種技術(shù)的未來發(fā)展過程中還有什么阻礙?

說得很對,市場上有很多公司提供了成功的單攝像機解決方案,比如XTR3d,Point grab,Eyesight等等。

這些解決方案很棒,它們可以給開發(fā)者們提供支持大多數(shù)設(shè)備的能力,而不需要加入額外的硬件設(shè)備或者考慮廠商的價格問題——不需要增加硬件設(shè)備,他們就可以用軟件搞定問題。但是,這些網(wǎng)絡(luò)攝像機的問題在于它們?nèi)鄙倌軌虿蹲郊毿幼鞯臏蚀_度,這些設(shè)備僅僅依賴于RGB數(shù)據(jù),在沒有照明的情況下數(shù)據(jù)就變得毫無意義。所以真正起決定作用的是交互方式,并不是所有的解決方案都符合開發(fā)者的需求。

我認為在未來會出現(xiàn)一個融合的解決方案,便宜的低端設(shè)備會依賴于軟件,但是較貴的設(shè)備會加入3D攝像機。已經(jīng)有越來越多的廠商把3D攝像機加入到設(shè)備上。比如和我們有戰(zhàn)略合作關(guān)系的因特爾,已經(jīng)宣布在2015年第一季度會和原始設(shè)備制造商(宏碁,華碩,戴爾,富士通,惠普,聯(lián)想,NEC)一起實現(xiàn)攜帶深度攝像機的平板、筆記本電腦,以及多功能產(chǎn)品。

問:你們用來解釋動作和面部表情的算法是什么?

因為我們支持的攝像機種類繁多,而且每種都提供了不同的輸入數(shù)據(jù),所以我們不得不為每個動作提供多種方式和算法。舉個例子,豎大拇指這個動作可以用深度攝像機輕易地識別出來,利用的是深度數(shù)據(jù)來找到手的關(guān)節(jié)點,然后根據(jù)位置排放來判斷手勢。但是運用網(wǎng)絡(luò)攝像機來尋找關(guān)節(jié),對于CPU來說要求就很高,甚至對于豎大拇指這樣的動作來說也很復(fù)雜。在這樣的情況下,我們會同時使用多重算法來尋找熟悉的突狀物體,膚色,集中特點,等等。

問:你以前的經(jīng)歷(在以色列國防部的工作)對你在動作識別科技的研究上有什么幫助?

我的大部分知識都是在軍隊里形成的。我在18歲的時候被招募到精英技術(shù)部隊。在軍隊里你可以從經(jīng)驗中學(xué)習(xí);當你有個任務(wù)不知道如何完成的時候,你需要快速學(xué)習(xí),否則就會被遣散。很幸運地是,我的戰(zhàn)友都是知識極豐富的人,而且不吝于分享他們的知識,這是一次很棒的經(jīng)歷。我無法告訴你具體的項目,因為這些是保密的信息,但是我可以告訴你的是,世界層次上計算機視覺領(lǐng)域中很多創(chuàng)新都是來自IDF(以色列國防部)。今天,計算機視覺和手勢識別領(lǐng)域的很大一部分公司都是以色列的。正是以色列公司Primesense的先鋒研究帶來了微軟的Kinect,隨后技術(shù)又賣給了蘋果。Kinect 2的技術(shù)基于飛行時間技術(shù),而這項技術(shù)是從以色列開發(fā)者3DV System ZCam那里來的。Google項目Tango是由以色列公司Mantis Vision的MV4D技術(shù)支持的。Pebbles互動與小米和Scandisk都有戰(zhàn)略合作伙伴關(guān)系。甚至因特爾的Real Sense大部分都是由以色列開發(fā)的,因為他們收購了兩家以色列相關(guān)領(lǐng)域的公司,Omek互動和Invision生物統(tǒng)計公司。更不用說今天流行的2D解決方案幾乎都是來自以色列的(XTR3d, Point grab, Eyesight)。

問:Onysus的團隊成分很是混搭,你們的員工有著不同的國籍,技術(shù)以及專業(yè)。這是公司創(chuàng)立時的本意嗎?這樣的一家“混搭”公司有著什么樣的優(yōu)勢?

我們強烈地相信異花授粉會帶來好處,最最創(chuàng)新的解決方案通常都是來自混搭的專業(yè)和想法。不同背景的人思考方式不同,兩個看似相反的意見相結(jié)合會帶來更加廣闊更加豐富的觀點。有件事在我身上發(fā)生了不止一次,一個創(chuàng)意部的同事找到我,說出一個看似離譜的點子,就當我快把這個想法忘掉的時候,我忽然意識到這是個多么天才的解決方案。計算機視覺,正如這個名字所暗示的,這是一門非常視覺的技術(shù),有視覺空間智慧的設(shè)計師與程序員截然相反,我們擁有的更多的是邏輯數(shù)學(xué)上的智慧,當你把兩種算法相結(jié)合,創(chuàng)新就開始了。我們的使用者就是設(shè)計師,這件事讓一切都更簡單了,我們的目標是雙贏。

問:你將在Top100全球軟件案例研究峰會上分享的關(guān)于3D空間交互的主題很有趣,其中提到了長期使用動作識別帶來的諸多問題,業(yè)界稱其為“猩猩手”,那么你是如何設(shè)計基于手勢的交互的?

確實“猩猩手”是基于動作的交互方式的大問題,因為長時間使用動作來交互對用戶來說既痛苦又不舒服。并不是所有的應(yīng)用都會從動作識別上獲得好處,其結(jié)果可能是非常有害的,但是在某些領(lǐng)域基于動作的交互方式可以極大地提高體驗。舉個例子,如果當你滿手油漬還想瀏覽烹飪書的時候,基于動作的交互可能是很理想的,但是當你想寫下食譜的時候,真的沒有必要從傳統(tǒng)鍵盤上脫離開來,這種情況下,動作識別的經(jīng)歷對于使用者來說是非常痛苦的。根據(jù)經(jīng)驗法則,如果你感覺用原有的方法做起來更順手那么你現(xiàn)在就是做錯了。動作識別并不是為了要取代我們所知道的輸入方式,而是要為開發(fā)者們一直在發(fā)展的工具箱中加入另外一個維度。

問:對于“無需觸碰”的應(yīng)用來說,需要使用什么樣的設(shè)計方法?

如果要構(gòu)建基于手勢的應(yīng)用,你需要考慮的第一件事就是你需要用什么樣的攝像機。如果你想要構(gòu)建需要全身識別的應(yīng)用,就需要長距離深度攝像機,而手勢識別需要短距深度攝像機,而面部識別可能只需要普通攝像機就可以了。另外一件需要注意的事就是不同人會用不同的方式來完成一個動作,甚至簡單的打個招呼都可以有很多方式,電腦也會解讀出不同的結(jié)果。

問:如何在不出現(xiàn)故障點的情況下測試故障點?

監(jiān)測故障點對于基于動作的交互來說很具有挑戰(zhàn)性,因為并沒有現(xiàn)成的具體工具可以用來分析和測試這樣的媒介。比如熱圖可以用來測試應(yīng)用和網(wǎng)站的用戶界面,因為這種方法可以顯示用戶活動并且根據(jù)鼠標或觸碰位置來判斷大眾的興趣。但是遇到基于動作的交互的時候,整個身體都是輸入數(shù)據(jù),所以熱圖技術(shù)就用不上了。對于我們自己的設(shè)備來說,我們需要開發(fā)一種可以提供具體交互相關(guān)數(shù)據(jù)的分析工具。要做到這點第一步就是要跟蹤和記錄使用者的骨骼,然后用這個數(shù)據(jù)找到故障的模式,一旦我們知道什么出了問題,修理起來就變得簡單了。


更多精彩,加入圖靈訪談微信!

本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊舉報。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
當 VR 遇上人工智能最火的“深度學(xué)習(xí)”,一種新的手勢識別技術(shù)就誕生了
解讀手勢識別,或許不是VR交互的萬能工具
深度干貨:VR動捕創(chuàng)業(yè)江湖!解放雙手的技術(shù)革命
下一個革命性的人機交互方式會是什么?
捕捉裸手動作、精準位置跟蹤,英特爾高級芯片設(shè)計師重構(gòu)VR、AR底層交互
體感互動
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服