北京2022年冬奧會(huì)和冬殘奧會(huì)不僅是各國(guó)健兒歡聚的運(yùn)動(dòng)盛會(huì),也是一場(chǎng)科技賦能的“智慧”盛會(huì)。為使更多人群感受到北京冬奧會(huì)的魅力,近日,在北京衛(wèi)視《北京您早》節(jié)目中,冬奧手語播報(bào)數(shù)字人全新“上崗”,為聽障人群帶來親切自然的冬奧手語播報(bào)服務(wù)。
手語播報(bào)數(shù)字人有何技術(shù)優(yōu)勢(shì)?數(shù)字人的手語播報(bào)怎樣兼顧速度與準(zhǔn)確性?冬奧會(huì)結(jié)束后,這項(xiàng)技術(shù)還能在哪些場(chǎng)景應(yīng)用?9日,記者走進(jìn)冬奧手語播報(bào)數(shù)字人研發(fā)企業(yè)之一智譜AI,在賽場(chǎng)之外,感受手語播報(bào)數(shù)字人的“過人之處”。
快人一步:手語播報(bào)更迅速
全國(guó)第二次殘疾人抽樣調(diào)查數(shù)據(jù)顯示,中國(guó)有超過2700萬名殘疾性聽力障礙人士。北京冬奧會(huì)是中國(guó)歷史上首次舉辦冬奧會(huì),聽障人群也期待著深入了解比賽資訊,全面感受冬奧盛會(huì)。
2月5日,采用超大規(guī)模智能信息模型和虛擬數(shù)字人技術(shù),為聽障人士打造的冬奧手語播報(bào)數(shù)字人正式亮相北京衛(wèi)視,為觀眾帶來冬奧期間賽事新聞的專業(yè)手語翻譯播報(bào)。
智譜AI合伙人及高級(jí)副總裁左家平介紹,冬奧手語播報(bào)數(shù)字人系統(tǒng)以超大規(guī)模預(yù)訓(xùn)練模型為核心技術(shù),自主搭建多模態(tài)肢體動(dòng)作、表情、手指同步采集系統(tǒng),運(yùn)用跨模態(tài)擬人生成算法、超高精度寫實(shí)數(shù)字人等行業(yè)領(lǐng)先技術(shù),實(shí)現(xiàn)冬奧期間賽事新聞的專業(yè)手語翻譯播報(bào)。
與傳統(tǒng)的人工手語播報(bào)相比,數(shù)字人播報(bào)有何優(yōu)勢(shì)?智譜AI首席技術(shù)官?gòu)堸i表示,手語播報(bào)數(shù)字人最大的優(yōu)勢(shì)是這是一套自動(dòng)系統(tǒng),不需要人工過多干預(yù),可大量節(jié)省人力。同時(shí),系統(tǒng)的運(yùn)行速度接近實(shí)時(shí),因此在呈現(xiàn)手語播報(bào)效果時(shí),比傳統(tǒng)的人工播報(bào)要快。
“學(xué)識(shí)”淵博:語料儲(chǔ)備更豐富
2018年,《國(guó)家通用手語常用詞表》和《國(guó)家通用盲文方案》作為語言文字規(guī)范正式發(fā)布。
為推廣和普及國(guó)家通用手語,冬奧手語播報(bào)數(shù)字人系統(tǒng)完成了《國(guó)家通用手語詞典》收錄的8214條通用手語的采集和錄制,并且語法都以聽障群體習(xí)慣打法為準(zhǔn),以確保手語播報(bào)成果的準(zhǔn)確性和專業(yè)度,更好服務(wù)聽障人群。
由于當(dāng)前中國(guó)缺少較完善的手語語料數(shù)據(jù),系統(tǒng)研發(fā)人員在北京市殘疾人聯(lián)合會(huì)和市殘聯(lián)聾人協(xié)會(huì)的支持下,邀請(qǐng)超過40位聾人老師及手語專家進(jìn)行手語文本轉(zhuǎn)寫和技術(shù)指導(dǎo),并進(jìn)行大范圍聽障群體評(píng)測(cè),最終構(gòu)建了符合國(guó)家通用手語規(guī)范的國(guó)內(nèi)最大規(guī)模多模態(tài)手語語料庫(kù),詞匯及語句總規(guī)模超10萬。
精準(zhǔn)翻譯:播報(bào)方式更智能
張鵬表示,與傳統(tǒng)的語音AI播報(bào)相比,冬奧手語播報(bào)數(shù)字人的最大區(qū)別是表意的準(zhǔn)確性和表達(dá)的可懂度:語音播報(bào)的技術(shù)特點(diǎn)主要集中在對(duì)語音的理解上;而面對(duì)聽障人士,手語播報(bào)還需要用具有韻律感的手勢(shì)、豐富甚至有些夸張的表情來提升播報(bào)的可懂度。
“聽懂”語音后,數(shù)字人如何將文字用手語更準(zhǔn)確地表達(dá)出來?據(jù)介紹,為構(gòu)建能理解、翻譯語音和手語的智能數(shù)字大腦,冬奧手語播報(bào)數(shù)字人系統(tǒng)以超大規(guī)模預(yù)訓(xùn)練模型為核心技術(shù),通過語義蒸餾及手語翻譯快編模型,將新聞播報(bào)語音蒸餾成語義高度接近的手語文字,并翻譯成符合手語習(xí)慣的語序。最終,手語數(shù)字腦可以通過計(jì)算機(jī)模仿聽障人士的大腦,進(jìn)行手語播報(bào)驅(qū)動(dòng)。
此外,為實(shí)現(xiàn)高精度、高自然度的人物形象和手語動(dòng)作姿態(tài),研發(fā)團(tuán)隊(duì)還自主搭建了多模態(tài)肢體動(dòng)作、表情、手指同步采集系統(tǒng)。通過肌肉綁定技術(shù)驅(qū)動(dòng)實(shí)現(xiàn)面部采集,結(jié)合業(yè)內(nèi)領(lǐng)先的語音識(shí)別及高清視頻合成等技術(shù),呈現(xiàn)給聽障人群親切自然的冬奧手語播報(bào)服務(wù)。
便利生活:應(yīng)用場(chǎng)景更廣泛
目前,冬奧手語播報(bào)數(shù)字人正在北京衛(wèi)視《北京您早》節(jié)目中對(duì)“冬奧賽事集錦”和“一起看冬奧”進(jìn)行手語播報(bào),手語信息播報(bào)服務(wù)降低了冬奧節(jié)目的運(yùn)營(yíng)成本,也便捷了聽障人士收看賽事報(bào)道的途徑。
未來,手語播報(bào)數(shù)字人有望在機(jī)場(chǎng)、車站、銀行等公共場(chǎng)所落地,方便聽障人士生活。此外,手語播報(bào)數(shù)字人的應(yīng)用還將助力國(guó)家通用手語推廣,推動(dòng)國(guó)家通用手語標(biāo)準(zhǔn)普及,為殘疾人平等參與社會(huì)生活創(chuàng)造無障礙環(huán)境,讓科技更有溫度。
據(jù)悉,冬奧手語播報(bào)數(shù)字人由北京市科委、中關(guān)村管委會(huì)支持,智譜AI、凌云光和北京廣播電視臺(tái)聯(lián)合打造,清華大學(xué)賈珈教授團(tuán)隊(duì)和中科院計(jì)算所陳益強(qiáng)研究員團(tuán)隊(duì)參與了相關(guān)關(guān)鍵技術(shù)的研究和開發(fā),項(xiàng)目還得到了北京市殘疾人聯(lián)合會(huì)和市殘聯(lián)聾人協(xié)會(huì)的幫助和支持。(完)
(文章來源:中國(guó)新聞網(wǎng))