(資料圖)
11月25日消息,在最新的中文語言理解領(lǐng)域權(quán)威榜單CLUE中,來自阿里達摩院的AI模型“通義AliceMind”以86.685的總分成績創(chuàng)造了新紀(jì)錄,這是該榜單誕生近三年以來,AI首次超越人類成績(86.678),意味著AI模型的中文語言理解水平達到了新的高度。
作為業(yè)界最權(quán)威的中文自然語言理解榜單之一,CLUE從文本分類、閱讀理解、自然語言推理等9項任務(wù)中全面考核AI模型的語言理解能力。過去三年,該榜單吸引了眾多國內(nèi)頂尖NLP團隊的參與,盡管榜首位置多次易主,但參評AI模型一直未能超越人類成績。
根據(jù)最新的結(jié)果,阿里通義AliceMind在4項任務(wù)中的表現(xiàn)超過人類水平,同時實現(xiàn)了總榜平均分的首次超越。
需要注意的是,中文語言理解是AI業(yè)界亟待攻克的難題之一。阿里方面表示,為提升AI模型對詞語、句子以及語言整體的理解力,在預(yù)訓(xùn)練階段,達摩院沿用超大規(guī)模模型訓(xùn)練所使用的海量高質(zhì)量中文文本,同時對模型結(jié)構(gòu)和訓(xùn)練技術(shù)進行了一系列優(yōu)化,如使用激活函數(shù)GLU、字詞混合的大詞表等獲得更強的文本建模能力,使用StrongHold訓(xùn)練加速技術(shù)縮短迭代周期、節(jié)約算力成本,進而獲得性能的顯著提升。在精調(diào)階段,面對文本分類、閱讀理解、自然語言推理等下游任務(wù),達摩院采用了遷移學(xué)習(xí)、數(shù)據(jù)增強、特征增強等技術(shù),進一步提升模型表現(xiàn)。
在應(yīng)用方面,通義AliceMind模型體系涵蓋預(yù)訓(xùn)練模型、多語言預(yù)訓(xùn)練模型、超大中文預(yù)訓(xùn)練模型等,具備閱讀理解、機器翻譯、對話問答、文檔處理等多種能力。目前,相關(guān)技術(shù)已應(yīng)用于醫(yī)療、電商、法律等領(lǐng)域,在跨境電商領(lǐng)域,達摩院的機器翻譯系統(tǒng)能提供214種語言的互譯服務(wù)。其基礎(chǔ)模型已在ModelScope平臺(魔搭,https://modelscope.cn)開放。
(文章來源:新京報)
標(biāo)簽: