北京時間3月15日凌晨,人工智能初創(chuàng)公司OpenAI公布新一代人工智能語言模型GPT-4。與ChatGPT所用的模型相比,GPT-4不僅能夠處理圖像內(nèi)容,而且在回答的細(xì)節(jié)和表述方面更有價值和人情味。
(資料圖)
“這是OpenAI努力擴(kuò)展深度學(xué)習(xí)的最新里程碑。”OpenAI在當(dāng)天的聲明中這樣表示。鑒于這是一個只訓(xùn)練了6個月且數(shù)據(jù)更新至2021年9月的模型,我們有理由推測出它的后續(xù)升級版本將可能做出更多令人驚艷的事情。有專家推測,OpenAI正在小心翼翼控制節(jié)奏,以防人們被太過聰明的工具“嚇”到。
GPT-4 VS ChatGPT
與ChatGPT相比,GPT-4最大的改變就是增加了圖片輸入支持,并可輸出圖片或文本。這使它從一個單純的文本聊天工具變成一個多模態(tài)語言模型。
目前圖像處理功能尚未公開,不過OpenAI在官網(wǎng)上展示了一系列案例。上海人工智能研究院研究員王資凱注意到,其中有一個案例是讓GPT-4預(yù)測將圖片中的氫氣球繩子剪斷后會怎樣。“這是一個涉及圖片理解、常識和推理的問題,沒見過氣球的人很難回答。”不過,GPT-4很好地預(yù)測了氣球的走向。“或許GPT-4已經(jīng)能根據(jù)周圍場景,猜出一個密閉的盒子里裝的是什么。”王資凱說。
在中國計算機(jī)學(xué)會術(shù)語工委副主任、同濟(jì)大學(xué)特聘研究員王昊奮看來,更能體現(xiàn)GPT-4水準(zhǔn)的要數(shù)它對于非自然圖像的理解,如圖表、考試題目截圖、論文截圖等,這也解釋了它為何能在各種考試中拔得頭籌。在演示中,GPT-4幫助美國一對虛擬夫婦在特定納稅年度里完成了報稅,這意味著它能讀懂大量知識性文檔。
GPT-4可輸入25000個詞,約是ChatGPT的八倍,這使得它的邏輯推理能力更上一層樓。據(jù)介紹,它已在包括美國律師資格考試、法學(xué)院入學(xué)考試、“美國高考”數(shù)學(xué)部分和證據(jù)性閱讀與寫作部分等考試中,得分高于88%的應(yīng)試者。
“角色扮演”讓GPT-4如有神助
“你是一位AI編程助手,第一步謹(jǐn)慎、逐字地遵循用戶需求;第二步一步一步思考,闡述你如何構(gòu)造代碼;第三步在一個單獨(dú)程序塊中生成代碼;第四步盡可能減少其他不嚴(yán)謹(jǐn)……”在官方發(fā)布的演示中,王昊奮注意到一個細(xì)節(jié),OpenAI總裁和聯(lián)合創(chuàng)始人格雷格·布羅克曼試圖讓GPT-4在回答復(fù)雜問題前先扮演某種角色。
“我們把這種引導(dǎo)稱為‘元指令’,也就是給機(jī)器一個人設(shè),比如一名醫(yī)生、一名律師、一名編輯等,然后告訴它要做什么工作。”王昊奮說。作為ChatGPT全球首批百萬用戶之一,王昊奮掌握了不少使用心得,角色扮演的“元指令”是他經(jīng)過長期使用后總結(jié)出的讓ChatGPT生成更好回答的方法之一。而在此次最新發(fā)布的GPT-4中,他發(fā)現(xiàn),OpenAI公司也注意到了這一現(xiàn)象,并有意引導(dǎo)機(jī)器去扮演某種角色。
讓機(jī)器擁有“人設(shè)”,是否意味著GPT-4已經(jīng)具備了智能?在王資凱看來,答案是肯定的。就像人類制造飛機(jī)沒有用鳥的方式,而是通過空氣動力學(xué)讓一套機(jī)械裝置飛起來了一樣,人工智能也用自己的方式擁有了智能。不過,人類也無需恐慌,因?yàn)檫@仍然只是一個工具,而且通往智能的道路并非只有一條。
數(shù)十款多模態(tài)語言模型將同臺競爭
就在GPT-4發(fā)布的幾天前,谷歌悄悄上線了一款炸彈級模型PaLM-E——足足有5620億參數(shù),它將真實(shí)世界的傳感器信號與文本輸入相結(jié)合,建立語言和感知的鏈接;根據(jù)計劃,百度將于今天發(fā)布類ChatGPT模型“文心一言”;而此前,由OpenAI前員工研發(fā)的ChatGPT競品Claude已開放API接口……正如ChatGPT上線后多位專家預(yù)測的那樣,自然語言處理的“戰(zhàn)國時代”即將到來,未來,全球估計將會有數(shù)十款多模態(tài)語言模型同臺競技。
在王昊奮看來,OpenAI并非風(fēng)光無限,而是感受到了切實(shí)的壓力,這導(dǎo)致了GPT-4匆忙上線。畢竟,“該模型最大的亮點(diǎn)圖文識別沒有放開測試,并不符合OpenAI的一貫風(fēng)格”。
不過,他也提醒人們注意,GPT-4的訓(xùn)練數(shù)據(jù)只更新到2021年,不排除后續(xù)會有更豐富的語料庫訓(xùn)練版本。這次,他們很快就將自家的圖像模型DALL-E整合進(jìn)GPT-4,不僅工程技術(shù)難度不容小覷,而且更考驗(yàn)?zāi)P腿诤蟽煞N類型數(shù)據(jù)的穩(wěn)定性和成本。專家預(yù)計,OpenAI內(nèi)部還藏有“殺手锏”,將再一次帶給人們沖擊。
標(biāo)簽: