訂閱電子報∣ 友善列印字體大小 文章分享-Facebook 文章分享-Plurk 文章分享-Twitter
Facebook開源AI翻譯模型,號稱比Google更精準、速度快9倍!
數位時代張庭瑜
獲取產業訊息零時差!立即訂閱電電公會電子報。

 

Facebook利用和傳統翻譯技術不同的機器學習技術,推出號稱比Google翻譯準確性更高、速度快9倍的全新翻譯技術。

想到翻譯,多數人會直接聯想到這是Google的拿手絕活。不過,擁有19億全球用戶的Facebook,也希望發展翻譯技術打破社群媒體間的語言隔閡。而今日,Facebook利用和傳統翻譯技術不同的機器學習技術,推出號稱比Google翻譯準確性更高、速度快9倍的翻譯技術。

採和Google不同的機器學習技術,同時具備翻譯速度和品質

過去Facebook已經在網站上用到許多翻譯技術,例如將用戶貼文自動翻譯成其他語言。

特別的是,Facebook這次在翻譯模型採用的是機器學習中的卷積神經網路(CNN)技術,而非現在較主流、同時也是Google使用的機器學習翻譯技術——遞迴神經網路(RNN)。

比較兩者,差異在於RNN處理資料時會按照順序,一次只能處理一個單字、從左至右或右至左逐字翻譯,由於較符合文字的排列邏輯、準確度高,為當今主流的機器學習翻譯技術。不過,這樣的處理模式有一個缺點,即是無法利用GPU可水平多工作業的高效能加快翻譯速度。

在模型中加入「多重跳躍」和「守門」機制,翻譯模式更像人類

相較下,過去主要用於視覺辨識的CNN,則是可以同時處理一整句文字,更能利用GPU的多工處理模式,提升翻譯效率。同時,為了讓翻譯結果更準確,Facebook在模型中多加了「多重跳躍注意力(multi-hop attention)」和「守門(gating)」機制。

Facebook採用卷積神經網路的翻譯模型,可一次處理多個單字,確認單字間的關聯性,找出下一個翻譯單字。
Facebook

不像過去為按照順序翻譯單字,「多重跳躍注意力」讓電腦在翻譯過程中會不斷確認單字間的關係,找出最相關的單字作為下一個要翻譯的單字。例如,若第一個翻譯的單字為動詞,那第二個單字可能會是相關的助動詞。而選出下一個翻譯單字後,「守門」機制則會審核目前翻譯出的整段句子,確認語句是否正確,藉此產出更好的翻譯結果。

翻譯結果優於Google

雖然這並非首次在翻譯模型使用CNN,但過去的CNN翻譯模型表現都遠不如RNN。而Facebook發表的全新CNN翻譯模型,不論準確度和速度都優於過去的翻譯模型。

根據Facebook發表的論文,從衡量翻譯結果的指標BLEU(bilingual evaluation understudy)可得知,以英文翻法文來看,新模型較過去最佳成果高了1.5BLEU,英文翻德文提高了0.5BLEU,英文翻俄羅斯語則提高了1.8BLEU。

根據Facebook發表的論文,Facebook採用卷積神經網路技術的最新翻譯模型(ConvS2S),翻譯表現比過去的翻譯模型要來的高分。
Facebook

Facebook已將該機器學習翻譯的訓練模型開源到GitHub。儘管目前該技術仍未實際用於Facebook服務中,但預期這套機器學習系統除了可用於翻譯,也能用於分辨對話不同主題、摘要文章,甚至能將對話中的不同概念聯想在一起,處理更複雜的問題。

資料來源:The VergeTechCrunchFacebook

訂閱電子報 友善列印 字體大小:
獲取產業訊息零時差!立即訂閱電電公會電子報。