計(jì)算機(jī)視覺(jué)作為一種人工智能的基礎(chǔ)技術(shù)應(yīng)用,使用場(chǎng)景多樣,市場(chǎng)潛力巨大。而計(jì)算機(jī)視覺(jué)又與傳感器密切相關(guān),只有經(jīng)過(guò)傳感器對(duì)環(huán)境信息的采集,才能進(jìn)而實(shí)現(xiàn)數(shù)據(jù)的存儲(chǔ)、處理以及后續(xù)的推理判斷與執(zhí)行。近日,意法半導(dǎo)體(ST)舉辦線上媒體溝通會(huì),與會(huì)嘉賓在對(duì)人工智能時(shí)代傳感器的技術(shù)發(fā)展與市場(chǎng)應(yīng)用進(jìn)行介紹時(shí)指出,計(jì)算機(jī)視覺(jué)將加速全局快門傳感器的應(yīng)用。
計(jì)算機(jī)視覺(jué)應(yīng)用于四大場(chǎng)景
計(jì)算機(jī)視覺(jué)是人工智能領(lǐng)域的一個(gè)重要分支,其可以讓計(jì)算機(jī)等智能設(shè)備從圖像、視頻以及其他視覺(jué)輸入的數(shù)據(jù)庫(kù)中提取有意義的信息,并對(duì)這些數(shù)據(jù)進(jìn)行處理,進(jìn)而采取行動(dòng)。目前,計(jì)算機(jī)視覺(jué)在生產(chǎn)生活當(dāng)中已有了很多實(shí)際應(yīng)用,比如智能手機(jī)中的面部識(shí)別技術(shù)就已經(jīng)被廣泛應(yīng)用于屏幕解鎖和電子支付等方面。
根據(jù)意法半導(dǎo)體亞太區(qū)影像事業(yè)部技術(shù)市場(chǎng)經(jīng)理林國(guó)志的介紹,計(jì)算機(jī)視覺(jué)的應(yīng)用場(chǎng)景大致可以歸納為四大類:首先是深度感應(yīng),主要用于面容識(shí)別、3D掃描等場(chǎng)景。這類應(yīng)用場(chǎng)景大致通過(guò)兩個(gè)全局快門傳感器搭建一組雙目攝像頭系統(tǒng),或者使用一個(gè)全局快門傳感器搭建結(jié)構(gòu)光攝像頭系統(tǒng)。
其次是生物識(shí)別,主要是采集人體各個(gè)部位的信息并用于身份識(shí)別,除人臉識(shí)別之外,還包括手勢(shì)檢測(cè)、指紋識(shí)別、虹膜識(shí)別等。
再次是增強(qiáng)現(xiàn)實(shí)、虛擬現(xiàn)實(shí)和混合現(xiàn)實(shí)等應(yīng)用場(chǎng)景,包括6DoF(六個(gè)自由度追蹤)和SLAM(同步定位與地圖構(gòu)建)。6DoF主要針對(duì)頭部行為,當(dāng)用戶戴上VR頭顯設(shè)備后就會(huì)得到6D感知能力,頭部可以做出左右、上下、前后六個(gè)角度的動(dòng)作。當(dāng)用戶需要掌握自己所處房間狀況時(shí),則可以通過(guò)SLAM發(fā)揮作用。此外,使用VR/AR設(shè)備還可以進(jìn)行生物識(shí)別,比如手勢(shì)檢測(cè)或者手勢(shì)追蹤。在這種場(chǎng)景下,設(shè)備可以通過(guò)用戶的一個(gè)手勢(shì),識(shí)別出該行為的目的,比如用戶在做一場(chǎng)演講時(shí),通過(guò)一個(gè)手勢(shì)就可以自動(dòng)翻到下一頁(yè)或者翻回到首頁(yè),或者通過(guò)手勢(shì)實(shí)現(xiàn)鼠標(biāo)的單擊和雙擊。
最后一類應(yīng)用場(chǎng)景是機(jī)器人與工業(yè)控制,如無(wú)人機(jī)和掃地機(jī)器人等。這些設(shè)備在使用過(guò)程中要避免相互碰撞,就需要具有物體檢測(cè)和場(chǎng)景分析能力。而在這些應(yīng)用場(chǎng)景中,傳感器都可以發(fā)揮關(guān)鍵作用。
全局快門與卷簾快門各具優(yōu)勢(shì)
由于計(jì)算機(jī)視覺(jué)的應(yīng)用場(chǎng)景與一般用途的攝像頭不同,并不注重靜態(tài)圖像的捕捉與色彩渲染,因此智能手機(jī)與監(jiān)控?cái)z像頭等設(shè)備中日常搭配使用的卷簾快門傳感器并不適用。林國(guó)志介紹,從拍攝角度劃分,圖像傳感器可以分為全局快門與卷簾快門兩大類型。
人們?nèi)粘=佑|的多數(shù)攝像頭,大都采用卷簾快門傳感器,比如智能手機(jī)的主攝像頭和自拍攝像頭,樓宇中安裝的監(jiān)控?cái)z像頭以及數(shù)碼相機(jī)中大都采用卷簾快門技術(shù)。因?yàn)檫@些應(yīng)用場(chǎng)景都需要捕捉彩色圖像,需要相當(dāng)高的分辨率。卷簾快門的設(shè)計(jì)目的正是為了捕捉靜態(tài)圖像和視頻拍攝,需要非常高的分辨率和顏色處理能力。
問(wèn)題在于,計(jì)算機(jī)視覺(jué)當(dāng)中采用卷簾快門傳感器都是逐行拍攝圖像的,整個(gè)圖像只有一幀。如果拍攝對(duì)象是車輛這樣的快速移動(dòng)物體,圖像就有可能發(fā)生扭曲,無(wú)法顯示拍攝對(duì)象原始形態(tài),使得機(jī)器無(wú)法判斷不同圖像中的車輛是不是同一輛車,也就無(wú)法用于計(jì)算機(jī)視覺(jué)的處理。
全局快門的原理則不同,其拍攝時(shí)間非常短,只要拍攝對(duì)象不是快速移動(dòng)的物體,成像效果就非常準(zhǔn)確,因此更加適用于計(jì)算機(jī)視覺(jué)。隨著計(jì)算機(jī)視覺(jué)在人工智能領(lǐng)域的應(yīng)用快速鋪開,也將促進(jìn)全局快門傳感器的發(fā)展。
意法半導(dǎo)體亞太區(qū)影像事業(yè)部技術(shù)市場(chǎng)高級(jí)經(jīng)理張程怡表示,目前全局快門傳感器在消費(fèi)性電子和汽車領(lǐng)域的應(yīng)用勢(shì)頭非常猛。消費(fèi)性電子上應(yīng)用最典型的就是人臉識(shí)別,無(wú)論智能門鎖、門禁管制,還是電子支付都已開始采用。汽車領(lǐng)域的主要應(yīng)用場(chǎng)景是駕駛者的監(jiān)控和對(duì)乘客監(jiān)控。此外,全局快門傳感器在機(jī)器人、繪制地圖、AR/VR等領(lǐng)域的發(fā)展勢(shì)頭也不錯(cuò)。
在談到全球快門是不是會(huì)全面取代卷簾快門傳感器時(shí),張程怡認(rèn)為,兩者各有優(yōu)勢(shì)。在拍攝靜態(tài)照片或視頻時(shí)卷簾快門的像素更小、解析度更高,在用于手機(jī)主攝像頭等設(shè)備中更具優(yōu)勢(shì),但全局快門在計(jì)算機(jī)視覺(jué)這類識(shí)別動(dòng)態(tài)影象方面更有優(yōu)勢(shì)。卷簾快門的畫點(diǎn)大概在1.1微米以下,而全局快門通常在2.2微米以上,單僅畫點(diǎn)尺寸上,兩者就代表了不同的應(yīng)用領(lǐng)域?;诖?,也可看出全局快門傳感器的技術(shù)發(fā)展趨勢(shì)像素尺寸持續(xù)縮小,畫點(diǎn)持續(xù)變多,功耗優(yōu)化。
目前,意法半導(dǎo)體消費(fèi)和工業(yè)用全局快門圖像傳感器已推出VD55G0 40萬(wàn)像素和VD56G3 150萬(wàn)像素兩款產(chǎn)品。這些產(chǎn)品在940nm處具有最高的量子效率,拍攝性能穩(wěn)?。徽叫蝹鞲衅鞯姆直媛逝c鏡頭最佳匹配,適合旋轉(zhuǎn)拍攝使用場(chǎng)景;拍攝時(shí)間很短,降低系統(tǒng)功耗,能夠在確保準(zhǔn)確成像的同時(shí)降低系統(tǒng)功耗。
(文章來(lái)源:中國(guó)電子報(bào))
標(biāo)簽: 計(jì)算機(jī)視覺(jué) 人工智能 市場(chǎng)潛力