訂閱電子報∣ 友善列印字體大小 文章分享-Facebook 文章分享-Plurk 文章分享-Twitter
微軟AI翻譯能力媲美人類,背後4大技術不可不知
數位時代高敬原
獲取產業訊息零時差!立即訂閱電電公會電子報。

機器翻譯最新突破,微軟AI研究團隊發布最新研究,表示透過深度神經網路以及人工智慧(AI)技術,可以有系統地將中文新聞文章翻譯成英文,厲害的是品質與準確率幾乎跟人類相當。

「你這是Google翻譯的喔?」過去大家對於電腦翻譯的印象,大多認為不夠準確,不過最近微軟AI研究團隊發布了一項最新研究,表示透過深度神經網路以及人工智慧(AI)技術,已經可以有系統地將中文新聞文章翻譯成英文,厲害的是品質與準確率幾乎跟人類相當,雖然這項研究成果並不能代表電腦可以完全解決翻譯問題,但卻是科技發展的重要里程碑。

雙語專業人員認證,AI翻譯準確率跟人類相當

人類在電腦翻譯領域已經努力了幾十年,甚至有許多語言專家認為電腦翻譯要完全達到人類水準幾乎不太可能。

微軟機器翻譯團隊研究經理Arul Menezes表示:「團隊想要證明,這套系統可以在像中文、英文,這類擁有較多數據、包含較多常見的新聞詞彙的情況下,翻譯出跟人類幾乎媲美的成果。」研究團隊蒐集了由專業人員翻譯過的2千個報紙上的句子,並請來雙語專業人員評估,發現AI系統的翻譯準確率已經跟人類相當。

微軟機器翻譯團隊研究經理 Arul Menezes認為,在擁有充分數據基礎的情況下,機器翻譯出來的結果可以跟人類媲美。
Microsoft

「機器翻譯達到與人類相同的水準是所有人的夢想,消除語言障礙、幫助人們彼此溝通,是非常有意義的事,值得我們多年為此付出努力。」微軟負責語音、自然語言和機器翻譯的技術團隊研究員黃學東(Xuedong Huang)說:「只是我們沒有想到這麼快就能實現。」

翻譯比語音辨識更複雜

智慧助理、智慧音響的出現,讓我們見識到語音辨識在生活中帶來的便利,不過電腦要「理解語言」比起「語音辨識」還要困難許多。

過去透過電腦翻譯網頁或文章,充其量只能翻譯大概的意思,但無法深刻掌握語言讓句子流暢、通順;而就算是人類在翻譯時,翻譯出來的成果也會些許不同,因為人類可以用不同的詞彙,表達出幾乎一樣的意思,但很難說哪種翻譯比較好或不好。

微軟亞洲研究院副院長周明說:「這就是為什麼機器翻譯比純粹的辨識任務複雜許多,因為人類可能用不同的詞彙來表達完全相同的意思,但未必能準確判斷哪一個比較好。」

微軟自然語言和機器翻譯研究員黃學東(Xuedong Huang)談到,機器翻譯達到與人類相同的水準是所有人的夢想。
Microsoft

里程碑背後的四種技術

微軟使用深度神經網絡(Deep neural networks)來訓練AI系統,讓翻譯結果可以更加接近人類,而這當中包含了四項技術。

雙重學習(Dual learning)

翻譯是雙向的,從中文翻譯到英文以及從英文翻譯到中文,這兩道過程可以互相提供反饋資訊,來訓練深度學習模型,系統會比對兩者的相似性,讓系統從錯誤中學習,也就是在沒有人類介入的情況下,系統能在翻譯的過程中持續精進。

審議網路(Deliberation networks)

系統會學習人類翻譯過程,會在第一次完成粗略翻譯後, 重新推敲原始句子、重新潤飾文字,讓翻譯的成果更加精煉而不機械化 

翻譯沒有唯一標準的答案,它更像是一種藝術。
微軟亞洲研究院副院長周明

聯合培訓(Joint training)

如同前面提到翻譯是雙向的,以中、英翻譯來說,英翻中可以為系統增加一個新的中文句子,同樣的中翻英可以提供一個新的英文句子,兩套語言交互翻譯下,就能豐富兩個語言系統的資料庫,如此一來就能同時改善兩種語言翻譯的準確率。

一致性規範(Agreement regularization)

這套方法是用來加強翻譯結果的準確性,簡單來說,機器翻譯可以從句子的左到右或右到左讀取內容,微軟認為不論從哪一個方向讀取,翻譯出來的結果必須一致才代表翻譯是準確的。

微軟表示,這套電腦統未來可以有更廣泛的應用,像是套用在微軟商業工具、App、Office軟體,或是以API的方式分享出去,但研究人員表示還有許多挑戰和問題等待突破,像是這套翻譯系統還沒有處理過即時新聞報導的經驗,因此雖然結果令人振奮,但並不表示已經完全解決機器翻譯的缺點及問題,但可以確定的是這除了是個令人驚奇的里程碑,同時也代表翻譯技術又更往前了一步。

資料來源:TechCrunchEngadgetMicrosoft

訂閱電子報 友善列印 字體大小:
獲取產業訊息零時差!立即訂閱電電公會電子報。