婷婷激情丁香六月开心五月,最新欧美精品一区二区三区,最新国产精品精品视频 视频,亚洲国产成人爱av网站,中文字幕av无码一区二区三区电影

首頁>> 公司信息>>新聞詳情

云知聲語音云第二次重大升級性能大幅提升

2013-04-25 11:15 《4PS呼叫中心國際標準研究中心》 咨詢電話:17317241681(微信同號)



    4月底“云知聲”的語音識別引擎進行了一次升級,這是繼今年一月份使用深度神經網絡(DNN)技術以來,云知聲語音的第二次重大升級。在這次升級中,識別引擎的識別率和響應速度均提升了30%之多。熟悉模式識別的人都清楚,如果能夠通過某種方法將識別性能一次性提升10%以上,即便識別速度比原來還低,其成就也足夠在國際知名期刊上發(fā)一篇高質量的論文了。云知聲此次能夠將識別率和速度同時提升30%,絕對令人咋舌。從目前的識別表現上來看,云知聲的語音識別準確率已經完全不亞于業(yè)內大佬科大訊飛,而引擎的處理速度則超越所有競爭對手,是其他人的3到4倍。

    在語音領域內,提升語音識別準確率的法寶大致有兩個:一個是算法,即所謂“技術創(chuàng)新”;另一個則是數據,即“數據驅動”。打個不太準確的比方,如果說先進的算法猶如一輛法拉利跑車,則海量的數據就是能令發(fā)動機發(fā)出震撼轟鳴的高性能汽油。讓一輛賽車高速前進,這二者缺一不可。但從某種程度上來說,先進的算法可以在一定程度上彌補數據不足的缺陷;而海量的數據也可以從一定程度上提升算法的外在表現。云知聲的升級,靠的是是什么呢?

    眾所周知,海量線上數據的積累相當不易,對于語音數據而言則更甚。語音的積累面臨著采集和標注兩大難題,相當費時費力。在語音引擎上線前的“種子期”,開發(fā)者一般會通過向相關機構購買或者是請人錄音的方式來獲取標注過的原始語音。但這種方式不太可能獲取“足夠”的語音,并且這類語音一般會跟線上的實際情況有較大差別(例如說話方式、用戶口音、設備質量、環(huán)境噪音等等)。除非有極為先進的算法,想基于這種數據來提供優(yōu)異的線上表現是相當困難的。獲取數據的另一種方式就是通過滾動,即通過“服務上線->積累用戶->用戶提供語音->語音標注->更新語音識別服務”的步驟來積累語音。這種語音積累方式由于數據精準而且成本較低,因而是最為有效的。但這種方式需要以一定的用戶量為基礎,如果初始的語音識別服務不夠好,吸引不來大量用戶貢獻語音,那么這種滾動方式純屬空談。這種模式對于比較成熟的語音識別服務商而言是必經之路。拿科大訊飛來說,其通過公有云、訊飛口迅、訊飛語音輸入法以及訊飛語點,在一家獨舞的情況下,經過近3年的積累,其用戶語音庫用“海量”來形容毫不為過。而云知聲則是在2012年6月剛剛成立的小公司,雖然在與搜狗合作之后小有名氣,但無論在時間還是產品上,都不可與科大訊飛同日而語,因此云知聲想靠單一產品短期內積累大量語音數據還是相當困難的。

    云知聲的高識別率勝在其更新速度驚人。2013年的1月初,云知聲剛剛宣布了其語音識別服務性能的第一次大跨步改進,使用基于深度神經網絡的語音模型替代了原有的基于高斯混合(GMM)的語音模型。如今時隔3個月,云知聲又進行了第二次更新,不得不說,這在語音識別領域內絕屬一個異類。

    語音作為人們獲取和溝通信息最方便、最有效的手段,智能語音交互技術對于各種移動互聯網終端改善用戶體驗具有不可替代的作用,語音識別技術的升級將帶來更高的識別性能和更好的用戶體驗。

    云知聲CEO梁家恩表示,“目前云知聲還有多項關鍵技術儲備,深度神經網絡DNN技術只是其中之一。DNN主要是提高發(fā)音模型的匹配性能,今后,云知聲還會在抗噪音、方言覆蓋以及語言領域支持等方面持續(xù)投入。”

 

共0條評論網友評論
  • 全部評論
共0條記錄(共頁)
向您推薦

新聞 按行業(yè)分類

廠商 按產品分類


        
總機:021-51601170 直線:021-58307717,17317241681(微信同號) 電子郵件:cct@51callcenter.com  瀘ICP備10026114號-4  行業(yè)交流俱樂部QQ:2919157212
地址:上海市浦東新區(qū)牡丹路60號東辰大廈810室  郵編:201204 上海趨天網絡技術服務有限公司 版權所有(2002-2018)