設(shè)為首頁(yè)加入收藏

微信關(guān)注
官方微信號(hào):南方財(cái)富網(wǎng)
加關(guān)注獲取每日精選資訊
搜公眾號(hào)“南方財(cái)富網(wǎng)”即可,歡迎加入!
APP下載會(huì)員登錄網(wǎng)站地圖

奇富科技全球頂會(huì)INTERSPEECH引熱議,旗下360借條升級(jí)為奇富借條,方言識(shí)別技術(shù)成焦點(diǎn)

2024-09-29 16:34 互聯(lián)網(wǎng)

  近日,奇富科技受邀出席了在希臘舉辦的國(guó)際語(yǔ)音通信與信號(hào)處理頂級(jí)會(huì)議——INTERSPEECH 2024,并發(fā)表了題為Qifusion-Net: Layer-adapted Stream/Non-stream Model for End-to-End Multi-Accent Speech Recognition的主旨演講,全面展示了其在語(yǔ)音識(shí)別技術(shù)領(lǐng)域的成就,為中國(guó)語(yǔ)音技術(shù)走向世界、參與全球競(jìng)爭(zhēng)樹立了新的標(biāo)桿。

  INTERSPEECH作為全球語(yǔ)音科學(xué)界最負(fù)盛名的年度會(huì)議之一,匯聚了來(lái)自世界各地的頂尖學(xué)者、研究人員及行業(yè)領(lǐng)袖,共同探討語(yǔ)音技術(shù)的最新進(jìn)展、挑戰(zhàn)與未來(lái)趨勢(shì)。這一平臺(tái)不僅代表了語(yǔ)音技術(shù)領(lǐng)域的最高學(xué)術(shù)水平,也是新技術(shù)、新理念交流與碰撞的絕佳場(chǎng)所,其權(quán)威性和影響力在業(yè)界無(wú)出其右。

  圖1:奇富科技在INTERSPEECH 2024會(huì)議做主旨演講

  在演講中,奇富科技介紹了可同時(shí)支持20多種方言的新一代奇富語(yǔ)音識(shí)別系統(tǒng)“QiFree”,這是國(guó)內(nèi)金融行業(yè)內(nèi)字錯(cuò)率最低的中文語(yǔ)音識(shí)別系統(tǒng)。在中文口音與方言語(yǔ)音識(shí)別領(lǐng)域的權(quán)威測(cè)試集KeSpeech的對(duì)比中,奇富科技憑借其在自動(dòng)語(yǔ)音識(shí)別(Automatic Speech Recognition, ASR)領(lǐng)域的深厚積累,實(shí)現(xiàn)了方言口音分類準(zhǔn)確率的顯著提升,達(dá)到了79.10%,遠(yuǎn)超KeSpeech的基線水平61.13%,這一數(shù)據(jù)直觀反映了奇富科技在語(yǔ)音識(shí)別準(zhǔn)確性上的卓越表現(xiàn)。同時(shí),在衡量識(shí)別錯(cuò)誤率的關(guān)鍵指標(biāo)——CER(Character Error Rate, 字符錯(cuò)誤率)上,奇富科技更是以8.08%的成績(jī),遠(yuǎn)優(yōu)于KeSpeech的10.38%,展現(xiàn)了其在中文方言識(shí)別領(lǐng)域的高效與精準(zhǔn)。

  表1:奇富科技“QiFree”性能效果與KeSpeech Baseline對(duì)比

  奇富科技自研的中文語(yǔ)音識(shí)別系統(tǒng)“QiFree”,打破了單一模型只能識(shí)別特定單一方言的困境,通過(guò)創(chuàng)新的層自適應(yīng)融合結(jié)構(gòu),借助共享信息編碼模塊更高效的提取方言信息,實(shí)現(xiàn)了即說(shuō)即譯,進(jìn)一步增強(qiáng)了語(yǔ)音機(jī)器人的實(shí)時(shí)交互能力。值得一提的是,“QiFree”不僅在普通話識(shí)別領(lǐng)域的CER上保持領(lǐng)先地位,更在冀-魯、江淮、膠-遼、蘭-銀等多個(gè)方言區(qū)域的識(shí)別性能上,相比過(guò)往最佳成績(jī)實(shí)現(xiàn)了超過(guò)15%的顯著提升。這一突破性成果得到了INTERSPEECH三位獨(dú)立審稿人的高度認(rèn)可,他們一致認(rèn)可奇富科技論文《Qifusion-Net:基于特征融合的流式/非流式端到端多口音語(yǔ)音識(shí)別框架》所展現(xiàn)的系統(tǒng)框架創(chuàng)新性與識(shí)別性能的卓越表現(xiàn),并一致授予其“ACCEPT”的評(píng)定。

  值得一提的是,在與國(guó)內(nèi)一流公司(如某科技巨頭及國(guó)內(nèi)影響力最大的語(yǔ)音識(shí)別開源社區(qū))的對(duì)比中,奇富科技同樣展現(xiàn)出了壓倒性的優(yōu)勢(shì)。即便是在面對(duì)參數(shù)規(guī)模更大、訓(xùn)練數(shù)據(jù)量更豐富的對(duì)手時(shí),奇富科技依然能以更低的CER(8.08% vs 15.61% vs 26.55%)脫穎而出,證明了其技術(shù)架構(gòu)的優(yōu)越性和算法優(yōu)化的高效性。此外,與全球領(lǐng)先的語(yǔ)音識(shí)別系統(tǒng)(如Openai-whisper v2)相比,盡管后者在通用語(yǔ)言識(shí)別上具有顯著優(yōu)勢(shì),但在中文方言識(shí)別這一細(xì)分領(lǐng)域,奇富科技依然保持了顯著優(yōu)勢(shì),這進(jìn)一步印證了其在方言識(shí)別技術(shù)上的全球領(lǐng)先地位。

  表2: 奇富科技“QiFree”關(guān)鍵指標(biāo)與國(guó)內(nèi)外一流科技公司對(duì)比

  奇富科技在INTERSPEECH 2024上的再一次精彩亮相,不僅是對(duì)其多年來(lái)在語(yǔ)音識(shí)別技術(shù)領(lǐng)域深耕細(xì)作成果的一次全面展示,更是向世界宣告了中國(guó)企業(yè)在這一領(lǐng)域的強(qiáng)大競(jìng)爭(zhēng)力和無(wú)限潛力。奇富科技正以其卓越的技術(shù)實(shí)力和創(chuàng)新精神,引領(lǐng)著方言識(shí)別技術(shù)的新一輪發(fā)展潮流,其旗下360借條升級(jí)為奇富借條,為全球語(yǔ)音通信與信號(hào)處理技術(shù)的進(jìn)步貢獻(xiàn)著中國(guó)智慧與中國(guó)力量。

   廣告