近日,在 MS MARCO 文本閱讀理解挑戰賽中,阿裏 AI 創造了閱讀理解能力測試的新紀錄,並在開放域問答任務上超越人類閱讀水平。
MS MARCO 挑戰賽是 AI 閱讀理解領域的權威比賽,包含100多萬問題和近千萬篇文檔,參賽機構提供的 AI 模型需要從這些文檔中找出100萬個問題的正確答案。測試結果顯示,阿裏 AI 模型在文檔檢索排序和開放域自動問答兩項任務都登頂榜首,其中在開放自動問答領域上超越人類水平,這意味著人工智能的閱讀理解能力達到新的高度。這次評比也吸引了衆多國際著名研究機構如微軟、百度、FACEBOOK等參加。
與斯坦福大學發起的 SQuAD 挑戰賽不同,MS MARCO 數據集模擬了搜索引擎中的真實應用場景,其難度更大,是機器閱讀理解領域最有應用價值的數據集之一。MS MARCO 挑戰賽需要參賽者提交的模型具備理解長文檔多段落,並回答複雜問題的能力。對于每一個問題,MS MARCO 提供多篇來自搜索結果的網頁文檔,AI 需要通過閱讀這些文檔來回答用戶提出的問題。但是,文檔中是否含有答案,以及答案具體在哪一篇文檔或段落中,都需 AI 自己來判斷解決。
更難的是,有一部分問題無法在文檔中直接找到答案,需要 AI 自由發揮做出判斷。這對機器閱讀理解提出了更高的要求,需要 AI 具備綜合理解多文檔信息、聚合生成問題答案的能力。
但阿裏 AI 正在往人類思維模式接近。阿裏巴巴的突破在于提出了基于“融合結構化信息 BERT 模型”的“深度級聯機器閱讀模型”,可以模仿人類閱讀理解的過程,先對文檔進行快速浏覽,判斷,然後針對相應段落進行精讀,並根據“自己的理解”回答問題。其中,阿裏巴巴自研的算法成果——“深度級聯機器閱讀模型”已被人工智能頂級學術會議 AAAI 2019收錄。
阿裏 AI 可以像人類一樣在閱讀並理解後快速應對天馬行空的問題。比如阿裏 AI 可以在毫秒內讀完2億字的巨著,相當于 5 本《大英百科全書》,並根據自己的理解快速回答100多萬個不同領域的不同問題。例如2014年足球世界杯的冠軍是誰?哈利波特在哪裏上學的?什麽是宇宙中最強的磁場?阿裏 AI 可以分別迅速給出答案,無懼“連環追擊”。
對人類而言,閱讀是獲取知識、不斷進步的重要途徑;對機器而言,同樣如此。阿裏AI 這一成果揭示了機器在理解大量複雜材料以及回答現實生活中複雜問題方面的潛力。這一技術已經應用在阿裏巴巴的電子商務平台。例如,去年在 Lazada 一次線上促銷活動前,阿裏 AI 僅僅花了 30 毫秒就學會了25 個在印尼促銷品銷售中的所有規則,並成功應用到聊天機器人中,在活動中回答問題方面的准確率達到了 96%。
阿裏巴巴達摩院語言實驗室 (NLP) 團隊致力與學術界、工業界同仁一起創新自然語言技術, 讓商業沒有語言障礙。團隊二十余次在國際自然語言技術競賽中取得冠軍成績:如2016年 CIKM Cup 電商搜索,2017年 IJCNLP 語法糾錯,2017年美國標准計量局英文實體識別,2018年機器閱讀理解首次超出人類回答精准率,2018年國際翻譯大賽5項第一等。團隊在杭州,北京,西雅圖,硅谷和新加坡都在廣泛招聘人才。