国产不卡在线观看在线_在线精自偷自拍无码成人网站_国产精品精华液网站_人人97人人超碰人人爽喊_一本一本久久a久久综合_日本A级乱子色网视频_午夜.DJ高清在线观看免费7_免费黄色软件下载_亚洲国产成人精品无码区99_免费理伦电影,国产精品人妻一区夜夜爱,日本e片色满视频在线观看,在线观看亚洲精品福利片

國家市場監(jiān)督管理總局主管

中國消費者協(xié)會主辦

維護消費者合法權益,引導消費者合理消費

當前位置:首頁 > 科技
關注第七屆數(shù)字中國建設峰會——首個支持30種方言混說語音大模型發(fā)布 用AI守護方言
2024-05-27 17:30 本文來源:中國消費者報•中國消費網(wǎng) 作者:武曉莉

中國消費者報報道(記者武曉莉)“唔該查嚇電話費吖”“儂幫阿拉查下話費好伐?”粵語,、上海話,、四川話……中國電信萬號智能客服每天接到幾百萬通電話,其中很大比例用方言撥打,尤其是一些地區(qū)的老人習慣說方言,甚至只會說方言,智能客服及人工客服都難以理解,,溝通效率難免大打折扣。據(jù)統(tǒng)計,,全國仍有約20%人口未普及普通話,,他們常常被隔絕在智能信息服務之外,難以享受到AI時代的便利,。

此次數(shù)字中國建設峰會上,,中國電信人工智能研究院(TeleAI)發(fā)布業(yè)內首個支持30種方言自由混說的語音識別大模型——星辰超多方言語音識別大模型,打破單一模型只能識別特定單一方言的困境,,可同時識別理解粵語,、上海話、四川話,、溫州話等30多種方言,,是國內支持最多方言的語音識別大模型。中國電信人工智能研究院用最前沿的語音識別技術,,讓溝通更加自然流暢,,為人們搭建一條通往AI時代溝通的橋梁。

AI讓語言文化煥發(fā)生命力

方言是中國文化多樣性的瑰寶,,傳承豐富的歷史文化內涵,;方言也是不同區(qū)域文化的靈魂,凝聚人們鄉(xiāng)情的根源,,具有豐富的人文價值,。然而,很多方言卻在社會經(jīng)濟快速發(fā)展中不斷消亡,,保護方言傳承語言文化已迫在眉睫,。

AI正在為傳承語言文化注入全新生命力,。方言語料采集,、記錄和歸納后,需保證能被后人正確理解,?!鞍倮锊煌祝锊煌簟备鞣N方言語法語音特征各不相同,傳統(tǒng)的方言研究依賴于調查者主觀感知標注,,人力工程量巨大且難以系統(tǒng)標注,。而AI能夠更高效、系統(tǒng)地對方言進行整理歸納,,對方言保護和傳承意義重大,。

構建高質量方言數(shù)據(jù)庫,是方言保護和研究的基礎,。當前,,中國電信人工智能研究院已構建超30種,超30萬小時的高質量方言數(shù)據(jù)庫,,方言數(shù)據(jù)庫在豐富性和高質量等層面均居于業(yè)內前列,。

TeleAI堅持自主研發(fā)創(chuàng)新,在中國電信CTO,、人工智能研究院院長李學龍帶領下,,推出了星辰語音大模型,通過超大規(guī)模語音預訓練和多方言聯(lián)合建模,,率先實現(xiàn)單一模型支持30種方言自由混說語音識別,,是國內支持最多方言、覆蓋人口最多的語音大模型,;研發(fā)團隊首創(chuàng)“蒸餾+膨脹”聯(lián)合訓練算法,,解決超大規(guī)模多場景數(shù)據(jù)集和大規(guī)模參數(shù)條件下,預訓練坍縮的問題,,實現(xiàn)1B參數(shù)80層模型穩(wěn)定訓練,;星辰語音大模型也是業(yè)內首個開源的基于離散語音表征的語音識別大模型,通過“從語音到token再到文本”的建模新范式,,將推理時語音傳輸比特率降低,。

星辰語音大模型以絕對領先的性能,斬獲多個國際賽事冠軍,。在INTERSPEECH2024離散語音單元建模挑戰(zhàn)賽上,,憑借星辰語音識別大模型的領先技術,中國電信人工智能研究院語音團隊斬獲語音識別賽道冠軍,。在業(yè)內知名的多方言語音識別數(shù)據(jù)集KeSpeech任務上,,星辰語音大模型打破紀錄,領先之前最優(yōu)結果20%,,以高達92.97%的字準確率刷新最優(yōu)結果,。同時在NIST(美國國家標準與技術研究院)組織的Babel低資源語音識別項目電話粵語賽道上刷新紀錄,取得目前業(yè)內最好結果,。

搭建AI時代溝通橋梁

隨著AI技術高速發(fā)展,,人們享受著智能化,、無人化服務的便利。中國電信有幾億用戶和豐富應用場景,,天然具備數(shù)據(jù)飛輪飛速轉動的優(yōu)勢,,無疑將促進技術更快進步,更好地服務每一個人,。

據(jù)悉,,星辰語音大模型已廣泛應用落地。星辰語音大模型已在福建,、江西,、廣西、北京,、內蒙古等地的中國電信萬號智能客服試點應用,,接入星辰大模型以后,萬號智能客服秒懂30種方言,,自然流暢地服務用戶,,實現(xiàn)日均處理約200萬通電話;智能客服翼聲平臺接入星辰大模型的語音理解和分析能力,,實現(xiàn)31省全覆蓋,,每天處理125萬通客服電話。此外,,星辰語音大模型還落地多地市的12345平臺,,賦能客服人員秒懂30種方言,更自然流暢理解更多市民需求,,提升溝通效率,,助力政務工作智能化升級,更高效,、便捷地為每一位市民提供服務,。

在此前的中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,星辰語音大模型讓數(shù)字人“能聽會說”,,數(shù)字人“數(shù)數(shù)”聲音甜美生動,、與康輝同臺主持,中英文隨意切換的,,交流對話自然流暢,,廣受好評。

星辰語音大模型現(xiàn)已對外開源,,攜手合作伙伴及個人開發(fā)者,,開發(fā)面向更多場景的應用,共同守護方言,、傳承語言文化,,助力AI普惠,。未來,,中國電信人工智能研究院將持續(xù)深耕研發(fā)創(chuàng)新,,不斷提高支持方言的數(shù)量和準確度,計劃建成首個覆蓋全國333個地市方言和主要少數(shù)民族語言的語音識別大模型,,切實讓每個人都能享受到AI時代的便利,。

責任編輯:呂成海