2013以來,隨著深度學習研究的巨大進展,基於人工神經網絡的神經機器翻譯逐漸出現。其技術核心是具有大量節點(神經元)的深度神經網絡,可以從語料庫中自動學習翻譯知識。壹種語言的句子經過矢量化後,在網絡中逐層傳輸,轉化為計算機可以“理解”的表達式,再經過多層復雜的傳導運算,翻譯成另壹種語言。實現了“理解語言,生成譯文”的翻譯模式。這種翻譯方法最大的優點是譯文通順,更符合語法規範,易於理解。相比之前的翻譯技術,質量有了突飛猛進的提升。
目前,遞歸神經網絡(RNN)廣泛應用於機器翻譯中。該模型擅長對自然語言進行建模,將任意長度的句子轉化為特定維度的浮點向量,同時“記住”句子中更重要的單詞,使“記憶”得以長期保存。該模型解決了自然語言句子的矢量化問題,對利用計算機處理自然語言具有重要意義,使得計算機對語言的處理不再停留在簡單的文字匹配層面,而是進壹步深入到語義理解層面。
包括加拿大蒙特利爾大學機器學習實驗室在內的代表性研究機構和公司發布了基於神經網絡的開源機器翻譯系統土撥鼠。2015年,百度發布了集成統計和深度學習方法的在線翻譯系統,Google也在這方面進行了深入研究。
上一篇:請問公安局基層執法崗位公務員對英語專業有視力要求嗎,面試有專業考試嗎?下一篇:誰能幫忙翻譯壹下沈復的閑情逸致?