步驟1:將原句分成組塊。首先,我們把句子分成簡單的塊,每個塊都可以很容易地翻譯。第二步:找出每個組塊所有可能的翻譯。接下來,我們將翻譯每個單詞,我們將通過在我們的數據庫中尋找所有人類翻譯的相同組塊來完成我們的翻譯。值得註意的是,我們不只是在簡單的翻譯詞典中查找這些詞塊。相反,我們看到真實的人如何在真實的句子中翻譯這些相同的單詞。這有助於我們捕捉不同上下文中的所有不同表達:即使是最常見的短語也有許多可能的翻譯,其中壹些比其他的使用頻率更高。根據我們訓練數據中每個翻譯出現的頻率,可以給它定壹個分數。比如,有人說“Quiero”的意思是“我想要”,而不是“我嘗試”。因此,我們可以在訓練數據中使用“Quiero”翻譯成“I want”的頻率來賦予“I want”的翻譯更多的權重。
第三步:生成所有可能的句子,並找出最有可能的壹個。接下來,我們將使用這些詞塊的每壹種可能的翻譯來組合並生成壹串可能的句子。