4月12日,中國移動(dòng)在首鋼園國家冬季訓練中心速滑館舉辦“5G新通話(huà),預見(jiàn)新未來(lái)”產(chǎn)品發(fā)布會(huì ),正式發(fā)布5G新通話(huà)產(chǎn)品,并宣布部分終端已在全國支持5G VoNR超清通話(huà)業(yè)務(wù),打造可視化、多媒體、高感知、全交互的全新媒體。
5G新通話(huà)可以讓通話(huà)雙方實(shí)現語(yǔ)音轉文字,同時(shí)還可以在屏幕上實(shí)時(shí)翻譯,讓通話(huà)人在聽(tīng)見(jiàn)的同時(shí),“看懂”通話(huà)的內容。看似好理解的技術(shù),背后蘊藏的大量“黑科技”,例如語(yǔ)音識別、口語(yǔ)理解、語(yǔ)音同傳等等,非深厚的AI語(yǔ)音技術(shù)積累不可為。
這些背后的“黑科技”,主要來(lái)自智能語(yǔ)音和人工智能的頭部企業(yè)科大訊飛,因此,科大訊飛也成為了中國移動(dòng)5G新通話(huà)的官方合作伙伴。
5G“殺手級應用”,今年7月后覆蓋所有新上機型
在發(fā)布會(huì )上,中國移動(dòng)市場(chǎng)經(jīng)營(yíng)部總經(jīng)理首建國介紹,與互聯(lián)網(wǎng)的語(yǔ)音視頻通話(huà)相比,5G新通話(huà)能夠基于中國移動(dòng)5G網(wǎng)絡(luò ),實(shí)現高清視頻通話(huà),通話(huà)質(zhì)量穩定,幾乎沒(méi)有時(shí)延,且電話(huà)呼入不中斷。同時(shí),結合AI技術(shù),5G新通話(huà)可以在通話(huà)過(guò)程中實(shí)現中英文實(shí)時(shí)翻譯、語(yǔ)音轉文字等功能,此外還提供了屏幕共享、遠程協(xié)作等特色功能。首建國還介紹說(shuō),目前5G新通話(huà)功能正陸續在各大手機終端進(jìn)行適配,到今年7月,所有終端新推出機型都將支持5G新通話(huà)。
從5G新通話(huà)所展示的功能來(lái)看,有望成為一款“5G殺手級應用”。在這一被業(yè)界普遍看好的業(yè)務(wù)背后,5G網(wǎng)絡(luò )是核心基礎,媒體互動(dòng)是重要功能擴展,終端支持是保障,其中還有一個(gè)關(guān)鍵,就是AI智能語(yǔ)音技術(shù)。
不僅聽(tīng)見(jiàn),還能看懂
科大訊飛是北京2022年冬奧會(huì )和冬殘奧會(huì )官方自動(dòng)語(yǔ)音轉換與翻譯獨家供應商。
資料顯示,面向冬奧會(huì )場(chǎng)景的多語(yǔ)種語(yǔ)音及語(yǔ)言服務(wù)平臺,采用了科大訊飛的“自動(dòng)語(yǔ)音轉換與翻譯”技術(shù),支持60個(gè)語(yǔ)種語(yǔ)音合成、69個(gè)語(yǔ)種語(yǔ)音識別、168個(gè)語(yǔ)種機器翻譯和6個(gè)語(yǔ)種交互理解,其中重點(diǎn)語(yǔ)種翻譯準確率達到了95%,平均每句翻譯響應時(shí)間不超過(guò)0.5秒。
口語(yǔ)化的流暢體驗
通話(huà)場(chǎng)景下有大量的口語(yǔ)化表達,口語(yǔ)化表達不同于規范的書(shū)面文本,一般表現為內容表述不符合語(yǔ)法規范、語(yǔ)氣詞過(guò)重、重復冗余等,這使得直譯時(shí)出現明顯的“機翻”痕跡,給機器翻譯在通話(huà)場(chǎng)景中的應用提出了更高的挑戰。
科大訊飛的技術(shù)負責人介紹,針對5G新通話(huà)口語(yǔ)化場(chǎng)景優(yōu)化,采取了三大措施:一是人機協(xié)同標注常用口語(yǔ)數據,并補充口語(yǔ)雙語(yǔ)訓練;二是系統性運用了無(wú)監督/弱監督訓練方法,基于大量口語(yǔ)化表達的源、目標語(yǔ)言單語(yǔ)數據,采用自訓練、回譯算法等強化翻譯模型和語(yǔ)言模型,對口語(yǔ)化表達特性實(shí)現增強訓練;三是針對語(yǔ)音識別后處理階段,設計語(yǔ)氣詞順滑、規整等模塊,將口語(yǔ)化表達盡可能書(shū)面化,從而減少機翻“痕跡”,幫助用戶(hù)更好地理解。
冠軍的底氣
中國移動(dòng)5G新通話(huà)背后的人工智能技術(shù),來(lái)源于科大訊飛23年來(lái)堅持源頭技術(shù)自主創(chuàng )新的深厚積累,科大訊飛在人工智能語(yǔ)音識別、機器翻譯、語(yǔ)義理解等技術(shù)領(lǐng)域處于國際領(lǐng)先地位,在諸多國際技術(shù)賽事中取得冠軍。
在語(yǔ)音識別領(lǐng)域,科大訊飛參加了2021年OpenASR國際低資源多語(yǔ)種語(yǔ)音識別挑戰賽15個(gè)語(yǔ)種受限賽道和7個(gè)語(yǔ)種非受限賽道,全部取得第一;在機器翻譯領(lǐng)域,先后獲得了2018年IWSLT國際口語(yǔ)機器翻譯評測比賽端到端任務(wù)第一和2021年IWSLT國際口語(yǔ)機器翻譯評測比賽英德語(yǔ)音同傳、文本同傳和英日文本同傳全部三個(gè)同傳賽道冠軍;在多語(yǔ)言理解領(lǐng)域,獲得世界權威多語(yǔ)言理解評測XTREME(Cross-Lingual Transfer Evaluation of Multilingual Encoders)四項任務(wù)中的三項最好成績(jì),標志著(zhù)科大訊飛多語(yǔ)言理解與跨語(yǔ)言遷移能力再上新臺階。在語(yǔ)義評測領(lǐng)域,在第十六屆國際語(yǔ)義評測SemEval 2022的比賽中,科大訊飛從30余支參賽隊伍中脫穎而出,獲得“多語(yǔ)種新聞相似度評測任務(wù)”和“多語(yǔ)種慣用語(yǔ)識別任務(wù)”兩項冠軍。
以數智化技術(shù)構建美好世界是人類(lèi)共同的希冀。5G新通話(huà)只是5G+AI有機融合的一小步,我們有理由相信,在中國擁有全球規模最大的5G精品網(wǎng)絡(luò ),擁有世界領(lǐng)先的人工智能自主核心技術(shù),科大訊飛和中國移動(dòng)這樣深度協(xié)同的模式,將會(huì )讓5G+AI發(fā)揮更大的融合倍增效應,必將加速推進(jìn)科技創(chuàng )新、推動(dòng)數智化轉型,共創(chuàng )人工智能美好新世界。