編輯:編輯部
【新智元導讀】腦洞問題:如果只看兩個AI頂會,其他一概不管,那麽最厲害的是哪些國家、哪些機構、哪些企業?按這個路子做出一個排行榜的話,又會是什麽樣子?(不許說野榜!)
還別說,專注科技界的風險投資公司Thundermark Capital 就年年做這個事,最近,這家公司又推出了他們一年一度的全球AI研究年度排名。
這次他們選擇的兩個頂會是:ICML 2021和NeurIPS 2021,一共3523篇論文(其中ICML爲1184篇,NeurIPS爲2339篇)。
不如一起來看看有沒有自己熟悉的名字?
2022年人工智能研究排名
Top50 國家/地區
排名 |
國家/地區 |
指數 |
排名 |
國家/地區 |
指數 |
1 |
美國 |
1801.3 |
26 |
越南 |
5.0 |
2 |
中國 |
431.1 |
27 |
阿聯酋 |
4.6 |
3 |
英國 |
189.0 |
28 |
智利 |
3.7 |
4 |
德國 |
131.8 |
29 |
挪威 |
3.1 |
5 |
加拿大 |
123.4 |
30 |
巴西 |
2.7 |
6 |
法國 |
116.3 |
31 |
伊朗 |
2.2 |
7 |
韓國 |
101.1 |
32 |
希臘 |
2.2 |
8 |
瑞士 |
100.2 |
33 |
土耳其 |
1.8 |
9 |
以色列 |
73.1 |
34 |
新西蘭 |
1.6 |
10 |
日本 |
62.1 |
35 |
巴基斯坦 |
1.3 |
11 |
新加坡 |
46.4 |
36 |
羅馬尼亞 |
1.3 |
12 |
澳大利亞 |
46.1 |
37 |
泰國 |
1.2 |
13 |
荷蘭 |
33.2 |
38 |
匈牙利 |
1.1 |
14 |
印度 |
31.2 |
39 |
克羅地亞 |
1.0 |
15 |
意大利 |
23.7 |
40 |
愛爾蘭 |
0.7 |
16 |
俄羅斯 |
18.9 |
41 |
哥倫比亞 |
0.5 |
17 |
奧地利 |
18.0 |
42 |
墨西哥 |
0.5 |
18 |
沙特阿拉伯 |
14.1 |
43 |
盧森堡 |
0.5 |
19 |
瑞典 |
13.0 |
44 |
捷克 |
0.5 |
20 |
丹麥 |
12.3 |
45 |
塞爾維亞 |
0.3 |
21 |
芬蘭 |
10.1 |
46 |
馬來西亞 |
0.3 |
22 |
中國台灣 |
8.5 |
47 |
烏拉圭 |
0.3 |
23 |
比利時 |
7.1 |
48 |
哥斯達黎加 |
0.2 |
24 |
西班牙 |
6.7 |
49 |
葡萄牙 |
0.1 |
25 |
波蘭 |
6.3 |
50 |
冰島 |
0.1 |
Top100 全球大學
由于篇幅有限,在表格中只列全球前20個AI研究排名的大學。部分大學表格內是縮寫(不一定嚴謹),後附全稱。
因爲Thundermark Capital本身的失誤,上圖中把南洋理工大學標爲中國的大學。相信新加坡的朋友們不會太介意……吧?
排名 |
學校 |
指數 |
排名 |
學校 |
指數 |
1 |
MIT(美國) |
107.1 |
11 |
EPFL(瑞士) |
42.5 |
2 |
斯坦福(美國) |
102.7 |
12 |
KAIST(韓國) |
42.4 |
3 |
CMU(美國) |
86.0 |
13 |
北大 (中國) |
41.1 |
4 |
UCB(美國) |
82.3 |
14 |
康奈爾(美國) |
39.6 |
5 |
牛津(英國) |
67.7 |
15 |
UW(美國) |
39.4 |
6 |
清華 (中國) |
65.5 |
16 |
NYU(美國) |
36.6 |
7 |
UCLA(美國) |
48.0 |
17 |
NUS(新加坡) |
35.2 |
8 |
ETH(瑞士) |
47.7 |
18 |
Gatech(美國) |
33.7 |
9 |
UT Austin(美國) |
47.6 |
19 |
哥大(美國) |
32.9 |
10 |
普林斯頓(美國) |
44.8 |
20 |
UofT(加拿大) |
32.4 |
MIT=麻省理工學院;CMU=卡內基梅隆大學;UCB=加利福尼亞大學伯克利分校;UCLA=加利福尼亞大學洛杉矶分校;ETH=蘇黎世聯邦理工學院;UT Austin=得克薩斯大學奧斯汀分校;EPFL=洛桑聯邦理工學院;KAIST=韓國科學技術院;UW=華盛頓大學;NYU=紐約大學;NUS=新加坡國立大學;Gatech=佐治亞理工學院;哥大=哥倫比亞大學;UofT=多倫多大學
其他上榜的中國大學還有:
排名 |
學校 |
指數 |
排名 |
學校 |
指數 |
27 |
上海交通大學 |
25.2 |
73 |
中國科學院 |
9.0 |
43 |
中國科學技術大學 |
16.0 |
84 |
複旦大學 |
7.6 |
48 |
南京大學 |
14.2 |
88 |
香港大學 |
6.7 |
53 |
香港中文大學 |
13.7 |
90 |
中山大學 |
6.6 |
54 |
香港科技大學 |
13.1 |
92 |
中國人民大學 |
6.4 |
62 |
浙江大學 |
10.8 |
Top100 全球企業
排名 |
企業 |
指數 |
排名 |
企業 |
指數 |
1 |
谷歌 (美國) |
200.2 |
11 |
百度 (中國) |
9.7 |
2 |
微軟 (美國) |
79.3 |
12 |
NTT (日本) |
7.5 |
3 |
Meta (美國) |
54.9 |
13 |
蘋果 (美國) |
7 |
4 |
亞馬遜 (美國) |
26.5 |
14 |
OpenAI (美國) |
6.7 |
5 |
IBM (美國) |
26.3 |
15 |
英特爾 (美國) |
6.7 |
6 |
華爲 (中國) |
21.8 |
16 |
Adobe (美國) |
6.2 |
7 |
阿裏巴巴 (中國) |
13.1 |
17 |
Salesforce (美國) |
6.0 |
8 |
英偉達 (美國) |
12.5 |
18 |
Yandex (俄羅斯) |
6.0 |
9 |
騰訊 (中國) |
10.2 |
19 |
NEC (日本) |
5.0 |
10 |
三星(韓國) |
10.0 |
20 |
VinAI (越南) |
4.5 |
其他上榜的中國企業機構有
排名 |
企業 |
指數 |
排名 |
企業 |
指數 |
23 |
字節跳動 |
3.5 |
42 |
聯發科 |
1.3 |
24 |
京東 |
3.5 |
50 |
快手國際版 |
1.2 |
25 |
快手科技 |
3.2 |
54 |
平安科技 |
1.0 |
26 |
曠視科技 |
3.0 |
62 |
啓元世界 |
1.0 |
27 |
商湯科技 |
2.9 |
66 |
第四範式 |
0.9 |
30 |
螞蟻集團 |
2.5 |
79 |
美團 |
0.7 |
37 |
地平線機器人 |
1.6 |
80 |
海康威視 |
0.7 |
41 |
網易 |
1.4 |
97 |
滴滴出行 |
0.5 |
排名方法
這個排名的方法參考了Nature Index,這個指標的計算方法是這樣的:
爲了收集一個國家、一個地區或一個機構對一篇文章的貢獻,並確保不會重複計算,Nature Index使用分數計算,綜合考慮到每篇文章的作者份額。
計入Nature Index的每篇文章總分爲 1,在每個人的貢獻相同的情況下,由所有作者平均分享。比如一篇文章有10個作者,那麽每個作者得到的分數爲0.1。如果一位作者所屬的機構不只一家,作者的分數會平均分配給這些機構。
最終,一個研究機構的總分,是旗下所有作者分配給該機構分數的總和。
國家/地區分數的計算過程與此類似,但由于一些機構有海外實驗室,這些實驗室將被計入所在國家/地區的總分,因此計算過程比較複雜。
說完了Nature Index,來說說這份報告的分數計算。
其實和Nature Index基本相同,唯一的區別是,這份報告將企業或機構的海外實驗室的論文計入其總部所在的國家/地區,而不是其實際駐在國家/地區。
確實,這麽算可能會有爭議,但這種方法更好地反映了知識産權的分配和對總部(而不是對當地實驗室)的利益累積。
以DeepMind爲例,這是一家位于英國的人工智能研究實驗室,2014年被總部位于美國的跨國公司谷歌收購。
按照上面的計算方式,DeepMind發表的論文會計入其目前的所有者——谷歌,也就是美國。這可能會讓英國的朋友們失望了。然而,僅憑會議論文集,在地圖上定位每個作者的位置過于複雜了,現在這個方法是唯一一致的作者身份處理方法。
希望這兩個AI頂會的組織者今後能進一步提供作者的詳細信息,這樣就可以排出兩個版本的榜單,一個是基于企業所有權結構的排名,另一個是基于作者所在地的排名。
舉一個具體例子。
如果一篇論文有五個作者——其中三個來自MIT,一個來自牛津大學,一個來自谷歌。首先,每個作者將得到五分之一的分數,即每人0.2分。因此,僅從這篇論文來看,MIT將獲得3*0.2=0.6分,牛津大學獲得0.2分,谷歌獲得0.2分。
由于MIT位于美國,所以美國的分數增加0.6分。同樣,由于牛津大學在英國,歐洲經濟區+瑞士+英國地區將增加0.2分。
最後,谷歌是一家總部設在美國的跨國公司,因此美國的分數將額外增加0.2,總共獲得0.8分。
如果一個作者附屬于多家不同機構,在計算時會把對應分數平均分給每個附屬機構。
比如上面說的這個例子,如果最後一位作者列出了兩個附屬機構,即谷歌和斯坦福大學,那麽谷歌和斯坦福大學都將獲得額外的0.2/2=0.1分。
從直觀的角度出發,谷歌的指數爲200,可以解釋爲谷歌在2021年的這兩個AI會議上發表了200篇完整的論文。
關于參考數據集,榜單發布方認爲,將ICML和NeurIPS的論文合並到同一個數據集中是公平的。
這兩個會議在頂級AI研究人員中的感知威望(可以理解爲「口碑」)接近。從研究機構的參與度,以及論文接受率上看,這兩個會議的表現也在伯仲之間。(ICML 2021接受率爲21.5%,NeurIPS 2021的接受率爲20.1%)。
實際上,這份榜單選擇ICML和NeurIPS這兩個會議作爲「機器學習」領域的評價標杆倒是有一定的道理。比如CVPR、ICCV這類頂會可能影響力更大,但它們都有明顯側重的子領域。
在中國計算機學會(CCF)發布的「中國計算機學會推薦國際學術會議和期刊目錄」上,在人工智能子類別下共列出了7個A類會議,ICML和NeurIPS均榜上有名。
根據去年7月更新的谷歌學術指標( Google Scholar Metrics )對各行業頂會和期刊影響力的排名,NeurIPS和ICML和在「工程和計算機科學」類別中分別位列第4位和第7位。
在清華AMiner對計算機科學頂會的排行榜上,結果也差不多。NeurIPS排名第2,ICML位列第4.
根據Guide2Research梳理的頂會排名,NeurIPS排在第2,而ICML則可以排到第6。
雖然說了這麽多,但綜合來看這套評價標准並不能稱得上有多嚴謹,但依然可以作爲參考看上一看。
各國AI研究態勢簡析
正如讀者可見到的,在過去的兩年裏,中國在人工智能領域進行了大規模的研究,其論文出版指數每年增加了52%和53%–考慮到ICML和NeurIPS會議的競爭程度,這是一個非常令人印象深刻的成就。
因此,中國的頂級高校清華大學從兩年前的第15位上升到今天的第8位,超過了Facebook、UCLA、ETH、EPFL、普林斯頓和UT Austin等強大競爭者。
另一所中國頂級大學北京大學,其AI研究的分數也緊跟清華大學,其論文出版指數落後一兩年(目前爲第16位)。
另一個巨大的進步來自于德國,在過去的兩年裏,德國的論文出版指數分別增加了42%和44%。
評分機構並未發現任何支撐此態勢的、單一的明星大學或公司(德國的入榜頂級機構是排名第42位的圖賓根大學)。
德國的AI研究增長勢頭,在地理上均勻分布于德國出名的馬克斯-普朗克研究所及各地的技術大學間。
此外,韓國的論文出版指數在過去兩年中分別提高了64%和32%。它在AI研究方面的仍才實力現在與瑞士相當(並略微超過)。
順便提一下,韓國的地區鄰居新加坡(尚未進入排名前十)表現驚人,在過去兩年中,其論文出版指數提高了128%和55%,目前排名第11位。
按照這個速度,它可能會在短短幾年內趕上日本(第10位)。
學術界與産業界占總發表論文的百分比
中美兩國,誰將在AI界領先
今天,一場關于美國和中國在AI領域占主導地位的戰略競賽狀況的激烈辯論正在進行。
2016年人工智能領域發生了兩件大事:
第一,谷歌的AlphaGo成爲第一個在無讓子的情況下擊敗圍棋九段職業選手李世石的計算機程序;
第二,奧巴馬總統的政府發布了一項關于AI未來方向和考慮的戰略,名爲《爲人工智能的未來做准備》。
作爲回應,中國在2017年提出了《新一代人工智能發展規劃》,不僅提出了政策上的支持還有數十億美元的研發投資。
據Thundermark Capital分析,由于中國的這種協同努力,美國在AI方面的技術優勢一直在迅速消失:
2017年,美國對中國有11倍的領先優勢;到2019年,美國下降到7倍的領先優勢;2020年,美國只剩下6倍的領先優勢;在寫這篇文章時,美國的領先優勢是4倍。
此外,艾倫人工智能研究所的分析發現,在被引用次數最多的前10%的論文中,中國的作者比例穩步上升。
人們可能會說,未來十年美國在人工智能方面的競爭力看起來並不樂觀。
然而,Thundermark Capital認爲,結果將取決于現代AI三個關鍵要素的進步的相互作用:算法、硬件和訓練數據,要想在該領域占據主導地位,就必須把這三者都做好。
在未來幾年裏,美國仍會在AI算法方面擁有強大的領先優勢,其基礎是MIT、斯坦福大學、CMU和加州大學伯克利分校等世界級大學幾十年的計算機科學進步。
此外,谷歌和Facebook等公司在AI學術會議上發表內部研究的開放性,爲頂級AI研究者創造了一個繁榮的生態系統,他們現在在學術界和産業界之間無縫流動。
此外,美國是硅谷最初以硅爲中心的定義的所在地,它一直處于硬件創新的前沿。
Thundermark Capital認爲,在未來五到十年內,中國要想在先進的微處理器技術方面趕上美國是非常困難的,尤其是考慮到英特爾、AMD和英偉達所擁有的龐大專利組合的保護。
然而,當涉及到訓練數據的可用性時,美國的優勢是值得懷疑的。獲取數據是更廣泛的隱私與公共利益爭論的一部分,美國傾向于選擇前者,而中國則選擇後者。
今天在中國,人工智能從數以億計的街頭攝像頭中掃描人臉,閱讀數十億條微信信息,並分析數以百萬計的健康記錄。這種訓練數據的可用性,加上中國的14億人口,爲中國創造了巨大的戰略優勢。
雖然難以得出結論,但作者仍然認爲前兩個因素(算法和硬件)將超過最後一個因素(數據的可用性),美國將在未來幾年內保持其在AI能領域的領先地位。
最近,針對中國的進展,白宮宣布爲人工智能和量子計算等研究領域注資10億美元,以回應許多政策顧問的「美國在這些鄰域落後于中國」的擔憂。
作者介紹
Gleb Chuvpilo是一家投資于深度技術初創企業的風險投資公司Thundermark Capital的管理合夥人。
他擁有麻省理工學院計算機科學和人工智能實驗室的碩士學位,以及賓夕法尼亞大學沃頓商學院的金融和戰略管理MBA學位。
參考資料:
https://thundermark.medium.com/ai-research-rankings-2022-sputnik-moment-for-china-64b693386a4
[R] AI Research Rankings 2022: Sputnik Moment for China? from MachineLearning
https://ccf.atom.im/