人工智能(AI)大模型的誕生,讓2023年成為人類歷史上一個(gè)重要年份——通用人工智能元年。這意味著以智能革命為代表的第四次工業(yè)革命已然到來,人類站到了智能時(shí)代的門檻上。
(資料圖)
人類所經(jīng)歷的前三次工業(yè)革命,都令人類文明實(shí)現(xiàn)了新的飛躍,也對世界格局產(chǎn)生了深遠(yuǎn)影響。長遠(yuǎn)來看,人工智能在很多方面的智慧能力將可能超過人類,但目前通用人工智能還需邁過多道門檻,才能真正實(shí)現(xiàn)強(qiáng)人工智能。
日前,中國科學(xué)技術(shù)大學(xué)知識(shí)計(jì)算實(shí)驗(yàn)室提出了新的知識(shí)模型“知識(shí)方程”,并以此為基礎(chǔ)建立新型專家系統(tǒng),通過與深度學(xué)習(xí)的結(jié)合,嘗試突破現(xiàn)有通用人工智能的技術(shù)瓶頸。
人工智能(AI)誕生至今只有短短60多年,但其發(fā)展經(jīng)歷了幾度跌宕起伏。近年來,深度學(xué)習(xí)技術(shù)為AI帶來了新的革命,其中包括我們熟悉的AlphaGo、ChatGPT等。
當(dāng)前AI技術(shù)在很多任務(wù)上取得了超越人類的成效,包括人臉識(shí)別、語音識(shí)別、字符識(shí)別等,在機(jī)器翻譯、問答和醫(yī)療診斷等領(lǐng)域也交出了令人相對滿意的答卷??梢哉f,AI已經(jīng)邁入能夠大規(guī)模落地應(yīng)用的階段。
不過,當(dāng)我們試圖將人工智能再向前推進(jìn),就會(huì)發(fā)現(xiàn)要克服其現(xiàn)有缺陷,還有待技術(shù)模式的創(chuàng)新與突破。
當(dāng)下大模型面臨4個(gè)關(guān)鍵缺陷
OpenAI公司推出的ChatGPT是一個(gè)AI聊天機(jī)器人程序,更是一個(gè)人工智能自動(dòng)生成內(nèi)容(AIGC)的工具。作為一個(gè)對話系統(tǒng),ChatGPT具備出色的多功能性,無論是暢聊多種話題、解答數(shù)學(xué)題,還是提供禮品選擇建議、制定行程規(guī)劃,都可從容應(yīng)對。因此,從某種意義上來說,ChatGPT具備了廣泛的應(yīng)用潛力和靈活性,可以說是一個(gè)通用人工智能(AGI)程序。
盡管在某些方面(例如邏輯和語義理解等)的評測表明,ChatGPT并非在所有領(lǐng)域都比現(xiàn)有的最佳模型更強(qiáng)大,但現(xiàn)有的最佳模型可能只是針對特定任務(wù)而設(shè)計(jì),而ChatGPT則是一個(gè)通用模型。
其實(shí),多年前人們就認(rèn)識(shí)到大模型的巨大潛力,但其實(shí)際發(fā)展速度仍比預(yù)想中快了許多。ChatGPT大模型甫一問世,很快就在應(yīng)用層面受到極大關(guān)注。半年后,中國就涌現(xiàn)出了百余個(gè)大模型。
目前,大模型的應(yīng)用主要分為生成式人工智能(AIGC)、大模型輔助工具、個(gè)人智能交互3類。其中,個(gè)人智能交互尤其值得關(guān)注。任何真正能促進(jìn)交互的技術(shù)和產(chǎn)品都能產(chǎn)生巨大價(jià)值。這種交互不僅包括“人—人”(通過機(jī)器),也包括“人—機(jī)”,甚至包括“機(jī)—機(jī)”。而人工智能,包括大模型,有望在這方面取得顛覆性突破。
然而,目前大模型的應(yīng)用之路并不如想象的那么順利。根本原因在于,雖然大模型很強(qiáng)大,但仍然在技術(shù)上存在一些關(guān)鍵缺陷。
首先,大模型有時(shí)會(huì)犯事實(shí)性錯(cuò)誤,也就是可靠性問題(俗稱“幻覺”)。例如,它會(huì)弄錯(cuò)詩詞作者。從原理看,大模型的答案選擇基于概率,所以很難保證百分百正確。這一問題在目前許多領(lǐng)域的大模型中都存在,也是大模型面臨的最重要的挑戰(zhàn)之一。
第二,大模型的數(shù)學(xué)和邏輯推理能力仍然需要加強(qiáng)。雖然GPT-4在某些考試中表現(xiàn)優(yōu)異,但在面對一些精心設(shè)計(jì)的邏輯推理問題時(shí),大模型的回答與隨機(jī)答案相差無幾。因?yàn)樵谶M(jìn)行深度推理時(shí),即便大模型每一步的預(yù)測準(zhǔn)確率都高達(dá)95%,但是當(dāng)推理到20步時(shí),最終的準(zhǔn)確率將會(huì)是0.95的20次方,即不到36%,這是一個(gè)無法令人滿意的結(jié)果。
第三,大模型的形式語義理解能力有待提升。雖然大模型在一定程度上能夠?qū)崿F(xiàn)語義理解,但要想真正從意義和形式上完全理解語言背后的意義,還有很大的改進(jìn)空間。
最后,大模型作為一個(gè)黑盒模型,存在一些通用弱點(diǎn)。比如,其可解釋性、可調(diào)試的能力較弱等。
通向強(qiáng)人工智能或需另辟蹊徑
大模型開啟了通用人工智能落地應(yīng)用的窗口。但正如前文所說,技術(shù)上的一些關(guān)鍵缺陷意味著它與通用強(qiáng)人工智能之間尚有很大距離。要縮短這個(gè)距離,至少有兩條不同路徑值得探索。
第一條路徑就是繼續(xù)沿著大模型現(xiàn)有的發(fā)展路線向前走。AI誕生不過60多年,GPT真正開始訓(xùn)練至今也只有5年。如果讓大模型再發(fā)展5年、50年、500年,它會(huì)取得怎樣的進(jìn)步?這是一個(gè)值得思考的問題。
沿著現(xiàn)有技術(shù)路線,大模型的發(fā)展在兩個(gè)關(guān)鍵點(diǎn)上會(huì)遇到一定的挑戰(zhàn)。
其一,更多的參數(shù)。參數(shù)量的增加,會(huì)讓大模型的能力提升。摩爾定律表明,計(jì)算能力每18個(gè)月到24個(gè)月翻一番,而目前大模型的參數(shù)量正以三四個(gè)月翻番的速度增長。因此,計(jì)算能力很快會(huì)跟不上模型的發(fā)展需求。而且,盡管參數(shù)量呈指數(shù)級(jí)增長,但其效果只呈線性增長。
其二,更多的數(shù)據(jù)。優(yōu)質(zhì)訓(xùn)練數(shù)據(jù)的增加,也會(huì)讓大模型的能力提升。然而,GPT-4已經(jīng)利用了大部分目前我們能夠獲取到的高質(zhì)量文本數(shù)據(jù)。因此,可供大模型訓(xùn)練的數(shù)據(jù)即將達(dá)到瓶頸。
所以,要在大模型體系內(nèi)解決這些問題,就需要發(fā)展新的顛覆性技術(shù),來突破結(jié)構(gòu)化信息、陳述性事實(shí)、長鏈條推理、深度語義理解等方面遇到的瓶頸。
另一條通往通用強(qiáng)人工智能的路徑則有很大不同。
當(dāng)前AI正在經(jīng)歷從感知智能向認(rèn)知智能的范式轉(zhuǎn)變。眾所周知,人類擁有兩套推理系統(tǒng),即直覺思考的快系統(tǒng)和理性思考的慢系統(tǒng)。快系統(tǒng)是一種底層、快速、下意識(shí)、不加思索便可即刻得到結(jié)論的推理方式,就像人們在家里閉著眼睛也能找到洗手間的位置;而當(dāng)我們面對陌生環(huán)境,想要找洗手間時(shí),則需要依賴慢系統(tǒng)進(jìn)行慎思,這種推理相對較慢、能耗較高,但更精確。
目前的大模型更多涉及到的是快系統(tǒng)層面的推理,慢系統(tǒng)推理能力表現(xiàn)還不佳。所以,人們自然而然就會(huì)想到,能否將這兩個(gè)系統(tǒng)結(jié)合起來。
事實(shí)上,上一波AI浪潮就是由專家系統(tǒng)驅(qū)動(dòng)的。專家系統(tǒng)是一種類似于人類慢系統(tǒng)的推理方式,它以符號(hào)的方式把專家的知識(shí)輸入機(jī)器,再通過自動(dòng)推理,使得機(jī)器能夠像專家一樣自動(dòng)回答問題。
專家系統(tǒng)與大模型各有所長。前者在精確度、可解釋性、邏輯推理能力、語義理解能力等方面表現(xiàn)更佳,而后者在通用性、泛化性、不確定性知識(shí)、學(xué)習(xí)能力等方面更具優(yōu)勢。因此,專家系統(tǒng)與大模型有機(jī)結(jié)合,正好可以取長補(bǔ)短,這或是通往通用強(qiáng)人工智能的一條更好路徑。
融合兩大推理系統(tǒng)探索未來智能
中國科學(xué)家在專家系統(tǒng)與大模型結(jié)合的道路上,已經(jīng)開始了探索。中國科學(xué)技術(shù)大學(xué)知識(shí)計(jì)算實(shí)驗(yàn)室提出了新的知識(shí)模型“知識(shí)方程”,在此基礎(chǔ)上建立起新型專家系統(tǒng),并將其與深度學(xué)習(xí)相融合。
簡言之,知識(shí)方程分為建模和知識(shí)2個(gè)層面。在建模層面,知識(shí)方程將領(lǐng)域?qū)ο蠼y(tǒng)一抽象成為個(gè)體、概念、算子3類語法元素,它們之間可以相互轉(zhuǎn)換、相互融合。在知識(shí)層面,知識(shí)方程將所有知識(shí)統(tǒng)一表示成為形如“a=b”的知識(shí)等式?;谥R(shí)方程,我們提出了基于新的數(shù)據(jù)與知識(shí)雙輪驅(qū)動(dòng)的、結(jié)合大模型與推理引擎的智能信息系統(tǒng)范式。
隨著ChatGPT等大語言模型的興起,在原有以數(shù)據(jù)庫為核心的信息系統(tǒng)之上,大模型可從暗數(shù)據(jù)庫(文本、圖像、視頻等)中挖掘有效信息,并在一定程度上進(jìn)行推理與(輔助)決策。
事實(shí)上,這是信息系統(tǒng)的一次范式革命。在所有數(shù)據(jù)中,暗數(shù)據(jù)占到絕大部分。傳統(tǒng)的信息系統(tǒng)必須通過一些手段(包括人工、自然語言處理、計(jì)算機(jī)視覺技術(shù)等),將“暗”數(shù)據(jù)轉(zhuǎn)換成數(shù)據(jù)庫中的“明”數(shù)據(jù)才能使用。這種轉(zhuǎn)換往往由于工程和成本等問題,只能處理暗數(shù)據(jù)中的極小部分。而大模型可以直接基于暗數(shù)據(jù)得以輸出,具有很強(qiáng)的暗數(shù)據(jù)處理能力。
基于大模型的信息系統(tǒng)類似于人類用于直覺思考的快系統(tǒng),能在一定程度上直接基于大數(shù)據(jù)進(jìn)行推理與決策。但由于大模型目前存在的技術(shù)缺陷,在很多應(yīng)用場景并不能直接滿足應(yīng)用要求。中科大知識(shí)計(jì)算實(shí)驗(yàn)室所提出的大模型增強(qiáng)技術(shù),可構(gòu)建領(lǐng)域本體與知識(shí)庫,在此基礎(chǔ)上融合大模型與知識(shí)推理引擎,研發(fā)知識(shí)數(shù)據(jù)雙驅(qū)動(dòng)的智能信息系統(tǒng)框架,將思考的快系統(tǒng)與慢系統(tǒng)結(jié)合起來。與單純的大模型相比,該框架具有正確性、可靠性、可解釋性、可調(diào)試性等優(yōu)點(diǎn),能夠顯著提高大模型在各行各業(yè)的應(yīng)用價(jià)值。
除了數(shù)據(jù)庫和暗數(shù)據(jù)庫,該系統(tǒng)還可有效利用知識(shí)庫的信息。因此,該框架有望引領(lǐng)大模型之后的又一次信息系統(tǒng)范式革命,也將成為智能信息系統(tǒng)的新形態(tài)。
從應(yīng)用角度看,通用強(qiáng)人工智能無論在廣度,還是在深度方面,都是現(xiàn)有的大模型技術(shù)無法比擬的。從長遠(yuǎn)來看,人工智能在很多方面的智慧能力可能會(huì)超過人類,不僅是計(jì)算、記憶和存儲(chǔ)等基礎(chǔ)智能,還可能包括決策、預(yù)測、創(chuàng)新等高階智能。隨著基于計(jì)算的大模型和知識(shí)推理引擎的不斷發(fā)展,AI也將越來越接近甚至超越人類,這將在極大程度上推動(dòng)生產(chǎn)力。
(作者為中國科學(xué)技術(shù)大學(xué)教授、知識(shí)計(jì)算實(shí)驗(yàn)室主任)
標(biāo)簽: