訂閱電子報∣ 友善列印字體大小 文章分享-Facebook 文章分享-Plurk 文章分享-Twitter
超越人類閱讀能力,阿里巴巴、微軟AI創紀錄,搶攻客服導覽工作
數位時代高敬原
獲取產業訊息零時差!立即訂閱電電公會電子報。

人工智慧又有新的突破,在具權威性的史丹佛大學閱讀理解測驗(SQuAD)上,阿里巴巴與微軟的AI機器學習模型的測驗成績首度超越人類,讓AI在「閱讀理解」項目再攻下一城。

「這是機器第一次在測試中超越人類。」人工智慧(AI)不僅擊敗圍棋世界冠軍李世乭,如今又在「閱讀理解」項目攻下一城。

 

阿里巴巴與微軟的AI機器學習模型,參與被認為最具權威性的史丹佛大學閱讀理解測驗,在分析500多篇維基百科文章、通過題目庫10萬條問題的隨機測驗後,最後出爐的成績都紛紛超越人類過去的紀錄。

阿里巴巴AI閱讀能力首度超越人類

由史丹佛大學研究人員所開發的史丹佛大學閱讀理解測試(Stanford Question Answering Dataset,簡稱SQuAD),被業界認為是最具權威與公信力的機器閱讀理解測驗,包括Google、IBM、Facebook、卡內基美隆大學等企業機構都曾參與。

人類過去在SQuAD測驗拿下最高的成績是82.304分,這次中國阿里巴巴所開發的人工智慧(AI)機器學習模型,在回答完一份由10萬條題目所組成的題目庫問題後,以82.44分的分數首度超越人類,接著微軟在相同的測驗中以82.650分同樣超越人類記錄。

阿里巴巴所開發的人工智慧(AI)機器學習模型,在閱讀理解測試中,以82.44分的分數首度超越人類,微軟也在相同的測驗中以82.650分超越人類表現。
shutterstock

消化大量資訊、模擬人類閱讀理解行為

SQuAD比賽由一個10萬條問題組成的機器閱讀理解題目庫組成,這些題目以500篇維基百科文章為基礎,主要用來測試機器是否能透過自然語言處理模仿人類對單字、句子的理解,在消化大量資訊後,精準地回答出問題。

AI在閱讀完題目庫中的一篇短文後,需要回答關於文章的幾個問題。例如,讓AI閱讀影集《異世奇人》資料,然後問「博士的飛船叫什麼名字?」;或是閱讀成吉思汗的歷史後,問「成吉思汗是哪年去世的?」

阿里巴巴研究團隊提出的「基於分層融合注意力機制」的深度神經網絡模型,是這項技術的重大突破,這款模型可以模擬人類在閱讀理解時的行為,包括串聯不同篇章的內容、帶著問題反覆閱讀文章、在閱讀時標註避免遺忘資訊等。

客服、導覽都派得上用場

阿里巴巴自然語言處理首席科學家司羅(Si Luo)表示,目前AI只能回答有明確答案的問題,如果問題表達的方式太模糊不清、不合語法、沒有預先準備好資料,AI有可能無法正常運作。

不過測驗結果還是相當振奮人心,「2018年有了一個強勁的開始。」SQuAD負責人Pranav Rajpurkar興奮地在Twitter上這麼寫下。

AI閱讀理解的精進,未來可以應用在客服、美術館導覽,甚至是回答病患的醫療問題。
shutterstock

透過AI閱讀理解的精進,未來將可以幫助人類處理大量資料、更加準確回答問題,「像是『為什麼會下雨?』這類客觀的問題就可以透過機器高度精準的回答。」首席科學家司羅(Si Luo)說:「這項科技可以應用在客服、美術館導覽,甚至是回答病患的醫療問題。」

成為第一家在閱讀理解測驗分數超越人類的科技公司,阿里巴巴近年加入騰訊、百度等公司的行列,積極在AI領域求突破,希望能借助AI發展社群媒體、廣告以及自動駕駛技術,中國也喊出要在2030年成為AI領域的領頭羊。

訂閱電子報 友善列印 字體大小:
獲取產業訊息零時差!立即訂閱電電公會電子報。