語音識別技術已經(jīng)成為全球科技大鱷競相追逐的黑科技,也是未來進入智能家居、智慧家庭的重要切入點,國際巨頭微軟、IBM、蘋果、谷歌一直在語音識別技術下足功夫,識別能力不相上下,IBM以誤碼率低的微小優(yōu)勢領先行業(yè)。
但近期出現(xiàn)反轉,就在此前,近期微軟宣布了一項關于機器理解人類語言的重要測試結果,即研究人員獲得了迄今最低語音識別會話誤碼率(WER) 6.3%,讓其成功登頂語音識別最低誤碼率,引起了業(yè)界關注。
據(jù)了解,該測試是美國國家標準局(NIST)的2000總機語音識別進行的任務。咨詢機構Wall Street Pit評論認為,微軟團隊轉向 作為行業(yè)標準的電話語音識別測試 成績斐然,鞏固了其在語音識別領域的霸主地位。
分析認為,微軟取得這一成績來自幾個方面的努力:研究人員在今年早些時候,應用深度神經(jīng)網(wǎng)絡技術贏得了一項計算機視覺挑戰(zhàn);微軟最近在計算網(wǎng)絡工具包(CNTK)中的成熟案例,也是獲得本次好成績的關鍵組成部分。CNTK實現(xiàn)了 深度學習算法 的復雜優(yōu)化升級,運行速度比原來提升一個數(shù)量級;另一個關鍵步驟是圖形處理單元的并行訓練能力取得了突破。
業(yè)內人士表示,近年來,大型軟件公司科研經(jīng)費有被縮減的趨勢,且更專注于深度神經(jīng)網(wǎng)絡的研究,但實際上,語音識別技術的應用更早一些。有評論稱,過去20年中,研究顯示的計算機語音識別系統(tǒng)的最高誤碼率甚至達到過43%,而隨后最出色的單系統(tǒng)NIST2000總機誤碼率為6.9%。
在近日于舊金山舉行的 Interspeech語音通信和技術國際會議 上,IBM驕傲地宣布其誤碼率只有6.6%。但此次微軟宣布的6.3%的誤碼率,以微弱優(yōu)勢取勝。
目前,微軟已經(jīng)制定出了基于語音平臺的人機交互策略,成功構建起人工智能的關鍵技術,讓相關語音對話在可穿戴設備、智能手機、智慧家庭、智慧車輛及商業(yè)服務中發(fā)揮重要作用。
文章編輯:CobiNet(寧波)
本公司專注于電訊配件,銅纜綜合布線系列領域產(chǎn)品研發(fā)生產(chǎn)超五類,六類,七類屏蔽網(wǎng)線/屏蔽模塊及相關模塊配件, 我們是萬兆屏蔽模塊,10G屏蔽模塊,屏蔽線生產(chǎn)廠家。
歡迎來電咨詢0574 88168918,郵箱sales@cobinet.cn,網(wǎng)址jsxlzg.com
?2016-2019寧波科博通信技術有限公司版權所有浙ICP備16026074號