“大模型訓(xùn)練一次就要花500萬美元”。
今年2月,原美團(tuán)聯(lián)合創(chuàng)始人王慧文高調(diào)入局AI時,就曾因?yàn)?000萬美元的資金遭到過一陣“嘲諷”。
兩個月過去了,這股始于ChatGPT的AIGC浪潮不僅沒有偃旗息鼓,反而愈演愈烈。越來越多的互聯(lián)網(wǎng)大佬下場創(chuàng)業(yè),體量較小的企業(yè)也紛紛推出自己的大模型。圍觀者驚嘆,原來高投入的大模型從來都不只是“大廠之間的游戲”。
(資料圖片)
“諸神之戰(zhàn)”
一天之內(nèi),大模型領(lǐng)域迎來了三位重量級的嘉賓。
先是搜狗公司創(chuàng)始人王小川,一封公開信正式宣告了“百川智能”的誕生。據(jù)了解,百川智能旨在打造中國版的OpenAI基礎(chǔ)大模型及顛覆性的上層應(yīng)用。
緊接著,兩家公司先后官宣。在當(dāng)天的技術(shù)交流日上,商湯科技董事長兼CEO徐立展示了“日日新”體系下的語言大模型“商量”,據(jù)悉,這是一個1800億參數(shù)的中文大語言模型,可實(shí)現(xiàn)多輪對話、邏輯推理、語言糾錯、內(nèi)容創(chuàng)作、情感分析等。
與此同時,昆侖萬維也表示,即將推出對標(biāo)ChatGPT的雙千億級大語言模型“天工”3.5,并定于4月17日啟動邀請測試。當(dāng)晚,昆侖萬維發(fā)布2022年年報(bào),明確提到“未來10年將堅(jiān)定的‘All in’AGI與AIGC”。
大模型成了這一輪AIGC浪潮的兵家必爭之地。百度“文心”、阿里“通義”、騰訊“混元”、京東“ChatJD”、華為“盤古”,傳統(tǒng)大廠無一掉隊(duì)。
垂直領(lǐng)域諸多企業(yè)紛紛入局,除商湯科技及昆侖萬維外,科大訊飛也在互動平臺表示,將于5月6日發(fā)布訊飛預(yù)訓(xùn)練大模型的詳細(xì)信息,大模型將用于教育、翻譯等領(lǐng)域。
互聯(lián)網(wǎng)大佬們更不畏懼大模型的“從0到1”。公開報(bào)道顯示,王慧文的 “光年之外”A 輪融資后估值已達(dá)到10億美元,前商湯科技副總裁閆俊杰新公司MiniMax的首款大模型產(chǎn)品 Glow累計(jì)用戶已突破百萬。
華西證券研報(bào)總結(jié)了現(xiàn)有國產(chǎn)大模型的兩個特征:一是頭部廠商主導(dǎo),To B為主要模式,賦能原有優(yōu)勢業(yè)務(wù);二是均未對公眾大面積開放,未有明確的ToC入口,實(shí)際水平不透明。
通用還是垂直
AIGC產(chǎn)業(yè)主要分為基礎(chǔ)和應(yīng)用兩個層面,前者包含理論框架的搭建、大模型的訓(xùn)練以及算法等,大投入、智力密集和長期性三個特點(diǎn)缺一不可。而后者主要是將別人開發(fā)出的東西與自己的業(yè)務(wù)進(jìn)行整合,見效快,成本相對也較低。
而這也是當(dāng)下中國AIGC企業(yè)押注的兩個方向,有人勢要成為中國的OpenAI,但也有人將目光瞄準(zhǔn)了垂直領(lǐng)域的應(yīng)用。
天使投資、資深人工智能專家郭濤表示,根據(jù)AI大模型應(yīng)用范圍的不同,可以分為通用型大模型和產(chǎn)業(yè)型大模型,通用型AI大模型在企業(yè)級與消費(fèi)級市場都擁有廣泛的應(yīng)用場景,如OpenAI旗下的ChatGPT;而產(chǎn)業(yè)型的AI大模型主要應(yīng)用于垂直行業(yè)或細(xì)分應(yīng)用場景,如京東旗下的ChatJD。
“整體來看,通用型大模型應(yīng)用場景相比產(chǎn)業(yè)型大模型更為廣泛,隨著規(guī)?;?、多樣化應(yīng)用場景的落地,促使算法模型快速迭代升級,不斷豐富和拓展新的應(yīng)用場景,市場競爭力也將會不斷增強(qiáng)?!惫鶟J(rèn)為。
但全聯(lián)并購工會信用管理委員會專家安光勇則提到,通用大模型在應(yīng)對多樣化任務(wù)時具有競爭力,而專業(yè)大模型在特定領(lǐng)域有深厚的技術(shù)積累和應(yīng)用優(yōu)勢。
安光勇認(rèn)為,體量相對較小的企業(yè)在大模型領(lǐng)域與“大廠”搶的主要是技術(shù)創(chuàng)新和應(yīng)用場景的拓展。相較于大廠,“小廠”在技術(shù)創(chuàng)新上通常更加靈活和敏捷,能夠迅速響應(yīng)市場需求,快速推出具有差異化和競爭力的大模型產(chǎn)品。
此外,小廠在應(yīng)用場景上可能更加專業(yè)化和垂直化,能夠深入某一領(lǐng)域或行業(yè),提供定制化的解決方案,滿足特定客戶的需求。此種專業(yè)化和靈活性為小廠在大模型領(lǐng)域與大廠競爭中帶來了一定的優(yōu)勢。
“‘大廠更適合做模型’其實(shí)是一種慣性思維?!痹Z智能聯(lián)合創(chuàng)始人兼COO朱雷解釋稱,通用的大模型解決不了具體行業(yè)的問題,尤其是在國內(nèi),大部分高質(zhì)量中文語料都在行業(yè)內(nèi),而不在公域的互聯(lián)網(wǎng)內(nèi),即便是大廠也很難拿到行業(yè)數(shù)據(jù),從這個角度上看,專用的模型在特定領(lǐng)域的效果一定要比大公司的通用模型更合適。
“這也決定了,在發(fā)展的過程中,大廠和初創(chuàng)公司的機(jī)會都是均等的。雙方都會選擇自己擅長的領(lǐng)域,再慢慢擴(kuò)大,就看是誰先在這上面演化出了更優(yōu)秀的產(chǎn)品??梢詳喽ǖ氖?,在這個巨大的浪潮面前,無論是初創(chuàng)企業(yè)還是大廠,都不會錯過這一波機(jī)遇?!敝炖籽a(bǔ)充稱。
AIGC該降溫了?
不久前,國際權(quán)威咨詢機(jī)構(gòu)IDC發(fā)布的《2022中國大模型發(fā)展白皮書》中預(yù)測,2026年中國人工智能軟件及應(yīng)用市場規(guī)模將達(dá)到211億美元,人工智能進(jìn)入大規(guī)模落地應(yīng)用關(guān)鍵期。數(shù)據(jù)顯示,自2020年起,中國的大模型數(shù)量驟增,僅2020-2021年,中國大模型數(shù)量就從2個增至21個,和美國量級同等,大幅領(lǐng)先于其他國家。
薩摩耶云科技集團(tuán)首席經(jīng)濟(jì)學(xué)家鄭磊認(rèn)為,在通用大模型方面,中美存在時間差,而應(yīng)用層則各有千秋。大模型訓(xùn)練成本高,初創(chuàng)企業(yè)目前投入的資金很快就會消耗光,需要多輪融資,而商業(yè)應(yīng)用前景不確定,這類投資不太適合存續(xù)期較短的創(chuàng)投基金投資,“建議政府將其作為新基建項(xiàng)目,引導(dǎo)社會資金共同投資”。
此外,鄭磊提到,由于還存在可能替代大模型的其他技術(shù)路線,國家也應(yīng)關(guān)注,及時加強(qiáng)研究支持,縮小與歐美技術(shù)差距。對于中小企業(yè)來說,可以根據(jù)市場定位和行業(yè)發(fā)展趨勢,選擇已有的合適的大模型作為垂直應(yīng)用研發(fā)的基座,逐步形成AI賦能的產(chǎn)品和服務(wù),借助市場力量推動產(chǎn)品研發(fā),形成在細(xì)分領(lǐng)域的競爭優(yōu)勢。
上個月末,一覽科技推出業(yè)界首個基于GPT大模型的“文本+圖片+虛擬人”視頻AIGC全域工作流,彼時,一覽科技創(chuàng)始人兼 CEO 羅江春就曾提到,AIGC工具只會越來越多,同質(zhì)化非常嚴(yán)重,說是新一輪“百團(tuán)大戰(zhàn)”也不為過,關(guān)鍵的問題是誰能解決某一個垂直領(lǐng)域用戶的根本需求。
“大模型需要降溫了。”于資本市場,深度科技研究院院長張孝榮做出了這樣的判斷。在他看來,大模型是人為炒作起來的一個現(xiàn)象,前期是國際巨頭推廣產(chǎn)品,后期是國內(nèi)資本市場跟進(jìn),炒作相關(guān)企業(yè)股價,許多公司股價脫離理性軌道,在短短幾個月的時間內(nèi)翻了數(shù)倍,導(dǎo)致資本市場發(fā)燒。
(文章來源:北京商報(bào))
標(biāo)簽: