對于刷臉消費(fèi)、刷臉解鎖這些“黑科技”,人們其實(shí)一點(diǎn)都不陌生,但如果要深入其中,普通人也只能說出一個(gè)關(guān)鍵詞:人臉識別。
而人臉識別技術(shù)實(shí)際上可以區(qū)分為2D和3D兩種。
1、2D人臉識別:
2D人臉識別是目前最為常見的人臉識別技術(shù)之一,其工作原理是后期人臉識別系統(tǒng)對圖片中的人臉進(jìn)識別,通過設(shè)定數(shù)百或數(shù)千個(gè)點(diǎn),并記錄點(diǎn)與點(diǎn)之間的函數(shù),該函數(shù)即為此人的面部信息。
2、3D人臉識別:
3D人臉識別是采用3D結(jié)構(gòu)光技術(shù),通過3D結(jié)構(gòu)光內(nèi)的數(shù)萬個(gè)光線點(diǎn)對人臉進(jìn)行掃描后,從而提供更為精確的面部信息,而這類面部信息并不會受到口紅、粉底等化妝品的影響。與2D人臉識別相比,3D人臉識別將提供更為精確的面部數(shù)據(jù),最終讓數(shù)據(jù)更加安全可靠。
“普通視覺傳感設(shè)備讓萬物看到世界,而3D傳感技術(shù)則讓萬物能像人一樣‘看清’世界?!?/p>
要談3D傳感技術(shù),就必須先弄清楚光學(xué)測量分類以及其原理。
光學(xué)測量分為主動測距法和被動測距法。主動測距方法的基本思想是利用特定的、人為控制光源和聲源對物體目標(biāo)進(jìn)行照射,根據(jù)物體表面的反射特性及光學(xué)、聲學(xué)特性來獲取目標(biāo)的三維信息。其特點(diǎn)是具有較高的測距精度、抗干擾能力和實(shí)時(shí)性,具有代表性的主動測距方法有結(jié)構(gòu)光法、飛行時(shí)間法、和三角測距法。
主動測距法
根據(jù)投影光束形態(tài)的不同,結(jié)構(gòu)光法又可分為光點(diǎn)式結(jié)構(gòu)光法、光條式結(jié)構(gòu)光法和光面式結(jié)構(gòu)光法等。
目前應(yīng)用中較廣,且在深度測量中具有明顯優(yōu)勢的方法是面結(jié)構(gòu)光測量法。面結(jié)構(gòu)光測量將各種模式的面結(jié)構(gòu)投影到被測物體上,例如將分布較密集的均勻光柵投影到被測物體上面,由于被測物體表面凹凸不平,具有不同的深度,所以表面反射回來的光柵條紋會隨著表面不同的深度發(fā)生畸變,這個(gè)過程可以看作是由物體表面的深度信息對光柵的條紋進(jìn)行調(diào)制。所以被測物體的表面信息也就被調(diào)制在反射回來的光柵之中。通過被測物體反射回來的光柵與參考光柵之間的幾何關(guān)系,分析得到每一個(gè)被測點(diǎn)之間的高度差和深度信息。結(jié)構(gòu)光的優(yōu)點(diǎn)是計(jì)算簡單,測量精度較高,對于平坦的、無明顯紋理和形狀變化的表面區(qū)域都可進(jìn)行精密的測量。其缺點(diǎn)是對設(shè)備和外界光線要求高,造價(jià)昂貴。目前,結(jié)構(gòu)光法主要應(yīng)用在條件良好的室內(nèi)。
飛行時(shí)間(Time of Flight,簡稱ToF)法,又叫做激光雷達(dá)(LiDAR)測距法。它將脈沖激光信號投射到物體表面,反射信號沿幾乎相同路徑反向傳至接收器,利用發(fā)射和接收脈沖激光信號的時(shí)間差可實(shí)現(xiàn)被測量表面每個(gè)像素的距離測量。ToF直接利用光傳播特性,不需要進(jìn)行灰度圖像的獲取與分析,因此距離的獲取不受物體表面性質(zhì)的影響,可快速準(zhǔn)確地獲取景物表面完整的三維信息。缺點(diǎn)則是需要較復(fù)雜的光電設(shè)備,價(jià)格偏貴。
三角測距法又稱主動三角法,是基于光學(xué)三角原理,根據(jù)光源、物體和檢測器三者之間的幾何成像關(guān)系來確定空間物體各點(diǎn)的三維坐標(biāo)。在實(shí)際測量過程中,它常用激光作為光源,用CCD相機(jī)作為檢測器。這種方式主要用于工業(yè)勘探、工件表面粗糙度檢測、輪胎檢測、飛機(jī)檢測等工業(yè)、航空、軍事領(lǐng)域,在消費(fèi)電子類產(chǎn)品還不曾涉及。
被動測距法
被動測距技術(shù)不需要人為地設(shè)置輻射源,只利用場景在自然光照下的二維圖像來重建景物的三維信息,具有適應(yīng)性強(qiáng)、實(shí)現(xiàn)手段靈活、造價(jià)低的優(yōu)點(diǎn)。但是這種方法是用低維信號來計(jì)算高維信號的,所以其使用的算法復(fù)雜。被動測距按照使用的視覺傳感器數(shù)量可分為單目視覺、雙目立體視覺和多目視覺三大類。
單目視覺是指僅利用一臺照相機(jī)拍攝一張相片來進(jìn)行測量。
因僅需要一臺相機(jī),所以該方法的優(yōu)點(diǎn)是結(jié)構(gòu)簡單、相機(jī)標(biāo)定容易,同時(shí)還避免了立體視覺的小視場問題和匹配困難問題。單目視覺方法又可分聚焦法和離焦法兩類。聚焦法是指首先使相機(jī)相對于被測點(diǎn)處于聚焦位置,然后根據(jù)透鏡成像公式求得被測點(diǎn)相對于相機(jī)的距離。相機(jī)偏離聚焦位置會帶來測量誤差,因此尋求精確的聚焦位置是關(guān)鍵所在。而離焦法不要求相機(jī)相對于被測點(diǎn)處于聚焦位置,而是根據(jù)標(biāo)定出的離焦模型計(jì)算被測點(diǎn)相對于相機(jī)的距離,這樣就避免了由于尋求精確的聚焦位置而降低測量效率的問題,但離焦模型的準(zhǔn)確標(biāo)定是該方法的主要難點(diǎn)。
雙目立體視覺的基本原理是從兩個(gè)視點(diǎn)觀察同一景物,以獲取在不同視角下的感知圖像,然后通過三角測量原理計(jì)算圖像像素間的位置偏差(視差)來獲取景物的三維信息。這一過程與人類視覺感知過程是類似的。
在雙目立體視覺系統(tǒng)的硬件結(jié)構(gòu)中,通常采用兩個(gè)攝像機(jī)作為視覺信號的采集設(shè)備,通過雙輸入通道圖像采集卡與計(jì)算機(jī)連接,把攝像機(jī)采集到的模擬信號經(jīng)過采樣、濾波、強(qiáng)化、模數(shù)轉(zhuǎn)換,最終向計(jì)算機(jī)提供圖像數(shù)據(jù)。一個(gè)完整的雙目立體視覺系統(tǒng)通??煞譃閿?shù)字圖像采集、相機(jī)標(biāo)定、圖像預(yù)處理與特征提取、圖像校正、立體匹配、三維重建六大部分。
多目立體視覺系統(tǒng)是對雙目視覺系統(tǒng)的一種拓展。
所謂多目立體視覺系統(tǒng),就是采用多個(gè)攝像機(jī)設(shè)置于多個(gè)視點(diǎn),或者由一個(gè)攝像機(jī)從多個(gè)視點(diǎn)觀測三維景物的視覺系統(tǒng)。對多目系統(tǒng)所采集到的景物圖像進(jìn)行感知、識別和理解的技術(shù)被稱為多目立體視覺系統(tǒng)技術(shù)。
在雙目立體視覺中,對于給定的物體距離,視差與基線長度成正比,基線越長,對距離的計(jì)算越精確。但是當(dāng)基線過長時(shí),需要在相對較大的視覺范圍內(nèi)進(jìn)行搜索,從而增加計(jì)算量。利用多基線立體匹配是消除誤匹配、提高視差測量準(zhǔn)確性的有效方法之?;€數(shù)目的增加可以通過增加相機(jī)來實(shí)現(xiàn)。
光電3D影像技術(shù)
根據(jù)獲取圖像信息方法的不同,光電3D影像技術(shù)分為有源和無源兩種技術(shù),無源技術(shù)主要是接受物體的輻射或者環(huán)境的發(fā)射,有源技術(shù)是通過投射一束調(diào)制的或未調(diào)制的光到物體上通過檢測物體反射的光來形成3D圖像。
以前大多數(shù)技術(shù)研究集中在無源3D技術(shù)上,利用三角測量原理,通過兩臺相距一定距離的照相機(jī),左邊照相機(jī)產(chǎn)生的圖像表示深度信息,右邊照相機(jī)產(chǎn)生差異的二維圖像。關(guān)鍵是產(chǎn)生深度信息的照相機(jī)需要分離出深度信息。無源3D影像技術(shù)需要拍攝的物體具有突出的輪廓特點(diǎn),比如邊緣、角、線等。其優(yōu)點(diǎn)是不需要特殊的硬件條件,并成功使用在好幾個(gè)方面。這種技術(shù)的缺點(diǎn)是需要兩臺或者更多的高質(zhì)量的照相機(jī)、圖像處理軟件。圖像質(zhì)量、拍照速度、數(shù)據(jù)傳輸?shù)榷际沁@種機(jī)制能否被廣泛應(yīng)用的限制因素。
有源3D光電圖像方法是投射一束有規(guī)律的空間分布的線狀光到物體上從而產(chǎn)生一個(gè)網(wǎng)狀格的深度。廣泛使用的有源光方法是飛行時(shí)間(time off light)方法,最近幾年,市場上出現(xiàn)的3D照相機(jī)都是基于飛行時(shí)間方法,這些3D照相機(jī)主要應(yīng)用于工業(yè)控制,通過飛行時(shí)間方法檢測相位來實(shí)現(xiàn)3D影像。一束幾十兆赫茲被調(diào)制的近紅外光照射到物體上,物體反射的光進(jìn)入3D照相機(jī),由于立體物體的遠(yuǎn)近距離不同,反射光的相位存在一個(gè)延遲,通過檢測原始光束以及反射光束的相位延遲從而檢測出物體的景深,從而實(shí)現(xiàn)3D圖像。這種3D圖像傳感器的制作由ZMD公司完成,ZMD公司根據(jù)3D圖像傳感器需要高速的特點(diǎn)從噪聲和速度進(jìn)行工藝優(yōu)化,響應(yīng)速度可以到100MHz以上。
3D傳感技術(shù)的應(yīng)用
其實(shí),除了用于手機(jī)的人臉識別,3D傳感技術(shù)已經(jīng)應(yīng)用到了很多方面,在2018中國互聯(lián)網(wǎng)大會上,有國人廠家推出的智慧家庭新生態(tài)解決方案,賦予電視3D人臉識別、精準(zhǔn)內(nèi)容推薦、手勢交互等創(chuàng)新功能,顛覆智慧家庭客廳體驗(yàn)。
通過3D人臉識別技術(shù),電視可在不獲取用戶隱私的前提下,精準(zhǔn)識別出機(jī)頂盒前的觀眾的用戶畫像信息,包括性別、年齡、情緒等等。同時(shí),系統(tǒng)根據(jù)登錄的用戶角色信息,通過綜合統(tǒng)計(jì)分析該用戶角色的行為數(shù)據(jù),可為用戶提供“千人千面”的個(gè)性化EPG界面,精準(zhǔn)推薦電視節(jié)目、視頻點(diǎn)播、游戲應(yīng)用等內(nèi)容。
此外,3D傳感技術(shù)可以賦能各行各業(yè):首先是機(jī)器人廠商,尤其是服務(wù)性機(jī)器人的眼睛需要3D視覺技術(shù),去感知周邊的環(huán)境,例如目標(biāo)距離、障礙物等信息;其次是安防廠商,在傳統(tǒng)的安防攝像頭里面再加裝一個(gè)視覺傳感器,就可以獲得一個(gè)更加精準(zhǔn)的三維立體信息;還有門禁門鎖,3D的刷臉識別相比2D的刷臉識別,安全等級和精準(zhǔn)性可以提升一級;最后,就手機(jī)行業(yè)的發(fā)展趨勢來說,3D傳感技術(shù)未來的應(yīng)用空間很大,刷臉等生物識別都離不開3D傳感技術(shù),此外VR、AR、美顏也可以搭載3D傳感技術(shù)去做一些交互性、娛樂性的體驗(yàn)。還有各種各樣的智能硬件,凡是需要采集物體深度信息的相關(guān)功能,都會用到3D傳感技術(shù)。