機器翻譯起源於1933。機器翻譯的想法是由法國工程師G.B. Arthuni提出的,並獲得了翻譯機專利。1954年,美國喬治敦大學在IBM的合作下,首次用IBM-701計算機完成了英俄機器翻譯實驗,揭開了機器翻譯研究的序幕。
1966年,美國科學院程覺三成立的平行宏詞自動處理咨詢委員會(ALPAC)發表了題為《語言與機器》的報告,否定了機器翻譯的可行性,進入衰退期。從65438年到0976年,加拿大蒙特利爾大學和加拿大聯邦政府翻譯局聯合開發的TAUM-METEO系統標誌著機器翻譯的全面復蘇。
1993年,IBM的Brown提出了基於詞對齊的統計翻譯模型,基於語料庫的方法開始流行。2003年,愛丁堡大學的Koehn提出了短語翻譯模型,明確或顯著地提高了機器翻譯的效果,促進了工業應用。2005年,常偉進壹步提出了層次短語模型,與此同時,基於語法樹的翻譯模型的研究也取得了很大的進展。
2013和14年,來自牛津大學、谷歌大學和蒙特利爾大學的研究人員提出了端到端的神經機器翻譯,開創了深度學習翻譯的新時代。2015蒙特利爾大學引入註意機制,神經機器翻譯達到實用階段。2016年,Google GNMT發布,NMT系統在科大訊飛上線,神經翻譯開始廣泛應用。