人工智能和加速計(jì)算正在共同改變技術(shù)行業(yè)。下一波人工智能浪潮將是一種被稱為具身AI的新型人工智能,即能夠理解、推理并與物理世界互動(dòng)的智能系統(tǒng)。
(資料圖片)
英偉達(dá)創(chuàng)始人CEO黃仁勛在2023年ITF世界大會(huì)發(fā)表視頻演講。他表示:“人工智能和加速計(jì)算正在共同改變技術(shù)行業(yè)。下一波人工智能浪潮將是一種被稱為具身AI的新型人工智能,即能夠理解、推理并與物理世界互動(dòng)的智能系統(tǒng)?!?/p>
黃仁勛介紹了英偉達(dá)的多模態(tài)人工智能系統(tǒng)VIMA,該系統(tǒng)可以根據(jù)視覺(jué)文本提示來(lái)執(zhí)行任務(wù),例如“重新排列對(duì)象匹配場(chǎng)景”。
據(jù)介紹,VIMA在英偉達(dá)的AI平臺(tái)上運(yùn)行,它可以學(xué)習(xí)概念并采取相應(yīng)的行動(dòng),例如機(jī)器可以識(shí)別兩個(gè)不同的物體,并能學(xué)會(huì)把一個(gè)小部件放進(jìn)一個(gè)容器中。
AI系統(tǒng)的能力表現(xiàn)在上下文理解和情境感知方面,具身AI能夠在現(xiàn)實(shí)世界中進(jìn)行操作和感知,更好地理解上下文和情境;通過(guò)物理環(huán)境的感知和實(shí)際操作,具身AI能夠獲得更全面的信息和數(shù)據(jù),進(jìn)一步提高對(duì)環(huán)境的理解和決策能力。
類似的例子在微軟近期發(fā)表的一篇論文中也有提到。微軟科學(xué)家向AI系統(tǒng)提出問(wèn)題:“我們這里有一本書、九個(gè)雞蛋、一臺(tái)筆記本電腦、一個(gè)瓶子和一個(gè)釘子,如何將它們牢牢地堆疊在一起?”
回答這樣的問(wèn)題需要對(duì)物理世界有直觀了解。AI系統(tǒng)的聰明回答讓研究人員們驚訝,他們認(rèn)為AI展現(xiàn)出了一定的人類邏輯能力。AI寫道:“把雞蛋放在書上,將它們排成三排,中間留出空間,小心不要把雞蛋弄碎了。然后將筆記本電腦放在雞蛋上面,筆記本電腦放在書和雞蛋正上方,他平坦堅(jiān)硬的表面將為下一層提供穩(wěn)定支撐?!?/p>
“理解了物理世界的人工智能可以學(xué)習(xí)模仿物理世界并做出符合物理規(guī)律的預(yù)測(cè)。”黃仁勛表示。此外,英偉達(dá)的元宇宙平臺(tái)Omniverse還運(yùn)行了VIMA的數(shù)字孿生。
他還稱,目前“具身AI”的實(shí)例很多,包括機(jī)器人技術(shù)、自動(dòng)駕駛汽車,甚至是聊天機(jī)器人?!霸跈C(jī)器人技術(shù)、自動(dòng)駕駛汽車和智能制造領(lǐng)域開(kāi)辟了數(shù)萬(wàn)億美元的市場(chǎng)機(jī)遇?!秉S仁勛表示。
具身AI涉及多種技術(shù),如機(jī)器人技術(shù)、計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、動(dòng)作規(guī)劃和控制等。英偉達(dá)的GPU架構(gòu)使得高性能計(jì)算在訓(xùn)練和推斷階段能夠更加高效地運(yùn)行,加速了具身AI技術(shù)的發(fā)展和應(yīng)用。
當(dāng)談到這樣的系統(tǒng)如何利好半導(dǎo)體行業(yè)的技術(shù)進(jìn)步時(shí),黃仁勛表示:“我期待物理人工智能、機(jī)器人技術(shù)和基于Omniverse的數(shù)字孿生有助于推動(dòng)芯片制造的未來(lái)。”
按照“具身AI”的定義,美國(guó)的科技巨頭都早已開(kāi)始布局。這是一種能夠通過(guò)感知、推理、決策和行動(dòng)來(lái)與環(huán)境互動(dòng),并具有自主決策和行動(dòng)的能力的人工智能系統(tǒng)。
例如特斯拉推出的人形機(jī)器人擎天柱就越來(lái)越具備這樣的能力,它們可以通過(guò)機(jī)器人的身軀來(lái)模擬人類的行為和動(dòng)作,以更加逼真地與人類進(jìn)行互動(dòng)。此外,特斯拉的Dojo AI超級(jí)計(jì)算機(jī)項(xiàng)目也用于加速訓(xùn)練和推理具身AI模型。
出門問(wèn)問(wèn)創(chuàng)始人李志飛對(duì)第一財(cái)經(jīng)記者表示:“具身AI可以理解為給AI大腦加上軀體,讓它去跟物理環(huán)境進(jìn)行交互,從而展現(xiàn)出智能體的行為?!彼a(bǔ)充道,這樣的“軀體”也并不是一定要像特斯拉的人形的機(jī)器人那樣。
目前已經(jīng)在開(kāi)發(fā)具身AI技術(shù)的知名企業(yè)包括波士頓動(dòng)力(Boston Dynamics),該公司的的機(jī)器人產(chǎn)品Atlas和Spot,已經(jīng)展示了先進(jìn)的感知、運(yùn)動(dòng)控制和自主決策能力。此外,蘋果、谷歌、亞馬遜、微軟等科技巨頭都已經(jīng)擁有了智能語(yǔ)音助手系統(tǒng),具身AI領(lǐng)域正處于快速發(fā)展階段,未來(lái)可能會(huì)涌現(xiàn)更多的創(chuàng)新和進(jìn)展。
隨著具身AI的能力和應(yīng)用范圍不斷發(fā)展,自身的性能和智能水平也將得到進(jìn)一步的提升,從而推動(dòng)人工智能的發(fā)展。但專家認(rèn)為,解決安全、隱私和倫理等問(wèn)題也同樣重要。
清華大學(xué)國(guó)強(qiáng)教授、智能產(chǎn)業(yè)研究院首席研究員聶再清對(duì)第一財(cái)經(jīng)記者表示:“由于具身AI在與人類互動(dòng)和操作的過(guò)程中需要收集大量的來(lái)自現(xiàn)實(shí)世界中的數(shù)據(jù),用于模型訓(xùn)練和改進(jìn),因此從保護(hù)數(shù)據(jù)隱私安全的角度來(lái)看,無(wú)疑是提出了更大的挑戰(zhàn)?!?/p>
(文章來(lái)源:第一財(cái)經(jīng))
標(biāo)簽: