中國消費(fèi)者報(bào)北京訊(記者武曉莉)8月8日,漢王科技2024新品發(fā)布會圓滿舉行,,致力于讓所有人都可以無障礙地進(jìn)行語言記錄,、交流溝通的首款智能語音應(yīng)用——漢王語音王APP發(fā)布。
據(jù)介紹,,漢王語音王是基于漢王自研多模態(tài)天地大模型,,自主研發(fā)的一款集AI語音記錄、智能翻譯與同聲傳譯于一體的智能語音旗艦應(yīng)用,,支持AI精準(zhǔn)轉(zhuǎn)寫,、拍錄同步(自動(dòng)裁邊)、話稿整理,、智能總結(jié)及不間斷實(shí)時(shí)翻譯等功能,用戶可以即聽即用,,幫助跨越語言障礙,,提高日常辦公、學(xué)習(xí),、會議,、旅游等場景的應(yīng)用效率和便捷性。
AI語音記錄精準(zhǔn)識別拍錄同步,。漢王語音王支持實(shí)時(shí)語音轉(zhuǎn)錄和語音文件轉(zhuǎn)錄兩種方式,,具備錄音速記、拍錄同步(自動(dòng)裁邊),、語音轉(zhuǎn)文字,、說話人精準(zhǔn)識別、智能總結(jié),、AI話稿整理等多種智能功能,。漢王科技自研高精度語音識別模型,具備高準(zhǔn)確率、多語言支持,、動(dòng)態(tài)修正和自然交流等特點(diǎn),。在行業(yè)廣泛使用的開源中文語音識別數(shù)據(jù)集上測試,錯(cuò)誤率低至1.94%,,處于領(lǐng)先水平,。
漢王語音王可以自動(dòng)修正錯(cuò)誤文本,內(nèi)容規(guī)整后無須二次編輯,,還支持自動(dòng)生成標(biāo)題,、總結(jié)記錄要點(diǎn)等。拍錄同步功能則是在錄音轉(zhuǎn)寫的同時(shí)拍照,,通過強(qiáng)大的原研OCR技術(shù),,在錄音類產(chǎn)品中首創(chuàng)照片自動(dòng)裁邊和內(nèi)容智能排版功能,為用戶直接提供一份聲,、圖,、文并茂的多媒體記錄文檔。
在會議,、頭腦風(fēng)暴等多人對話場景中,,準(zhǔn)確分離出每個(gè)人的身份以及內(nèi)容具有極大挑戰(zhàn),聲紋識別成為關(guān)鍵,。漢王科技聲紋識別技術(shù)具備在不限定用戶說話內(nèi)容的情況下,,最短2秒準(zhǔn)確識別說話人的能力。漢王科技解決了場景中的各種環(huán)境噪聲和回響,,以及說話人語速和情感變化等復(fù)雜情況下的識別準(zhǔn)確性問題,,在復(fù)雜場景下能夠提供穩(wěn)定的準(zhǔn)確識別率。同時(shí),,引入聚類算法等實(shí)現(xiàn)了結(jié)合聲紋和語義特征,,進(jìn)一步提高識別的準(zhǔn)確性。
當(dāng)整理好會議紀(jì)要,、演講內(nèi)容等后,,漢王語音王能與電紙本一鍵分享,將語音文本一體化傳輸?shù)诫娂埍旧线M(jìn)行高效閱讀辦公操作,,實(shí)現(xiàn)多端互聯(lián),、共享的應(yīng)用生態(tài)。
對話翻譯即時(shí)捕捉自然準(zhǔn)確,。具備實(shí)時(shí)翻譯和語音合成兩大能力,,可以精準(zhǔn)捕捉每一句對話,即時(shí)翻譯,,讓大家可以跨越語言界限,,適合辦公,、教育和旅游等場景下無障礙交流溝通。
基于漢王自研天地大模型的對話翻譯,,具備更好的語義理解和上下文聯(lián)系能力,,以及自適應(yīng)語言風(fēng)格和行業(yè)領(lǐng)域,提供更準(zhǔn)確和自然的翻譯內(nèi)容,,表達(dá)更清楚,、交流更順暢。漢王科技自研的語音合成系統(tǒng)不僅具有卓越的多音字準(zhǔn)確識別能力,,還能處理各種復(fù)雜多變的語音現(xiàn)象,。漢王科技自研高自然度聲學(xué)模型,并引入了恒Q變換等多項(xiàng)先進(jìn)技術(shù),,讓合成語音能更加高效和精準(zhǔn)地還原人類語音特性,。
漢王語音王同聲傳譯功能具備長時(shí)段不間斷即時(shí)翻譯能力,實(shí)時(shí)雙語對照文字記錄,,更能準(zhǔn)確表達(dá)專業(yè)術(shù)語和詞句表達(dá),。加上配錄同步功能,跨越語言的障礙,,幫助用戶輕松解決超長時(shí)間國際會議,、學(xué)術(shù)研討的內(nèi)容記錄難題。
