目前可以實時使用AI翻譯模塊。但是由於各種因素,比如每個人說話的停頓,發音不標準,重復多余的字如額,井等。,語音識別需要壹定的語音緩沖和對上下文的理解才能正確識別單詞、詞和短句,而語音翻譯則需要根據識別出的單詞進行翻譯。壹旦單詞識別錯誤,尤其是發音相同的不同單詞翻譯成不同意思時,錯誤會非常離譜。當然,翻譯本身也很可笑。所以識別模型、文字處理模型、翻譯模型都需要針對具體場景進行針對性的訓練,但是模型本身的計算不會引入太多的延遲,而另外兩個延遲是在字、音、圖同步和二次編碼中引入的。同時為了兼容壹些語速快的人群,保證字符能顯示壹定時間,需要增加壹些延遲。
綜上所述,AI翻譯處理會在整個直播鏈路中引入500ms~2s的額外延遲。
所以我們可以看壹下整個鏈路延遲,AI翻譯直播的端到端理論延遲可以在1s左右。全球速賣通跨界直播是實時直播場景,延時5-10s,屬於實時直播範疇,AI翻譯引入的額外延時可以忽略。
而且不僅是電商直播,遊戲直播也可以添加實時字幕和翻譯。比如今年的S10賽事,某直播平臺利用阿裏雲的實時字幕功能,對大型比賽賽事進行了實時字幕直播。
上一篇:商務信函的英語翻譯下一篇:美寶蓮眼唇卸妝水。