【文/任澤平、連一席、謝嘉琪】
人工智能産業競爭是各國政策、基礎研究、技術、資本等各方面綜合實力的競爭。目前各國政府高度重視人工智能,在基礎設施搭建、基礎科研、人才培養、資助研發、合作交流等方面給予支持鼓勵。資本和企業也積極尋求商業落地場景,協助技術轉化。技術落地于垂直領域,繼而産生新的數據,促進算法更新叠代,還可以進一步服務于垂直領域,如此循環往複、不斷發展。在這場全球競賽中,中國的優勢在于擁有海量數據和實踐經驗,但在基礎科研、基礎技術、前沿拓展方面仍存在薄弱環節。
2020世界人工智能大會雲端峰會7月9日上午在上海世博中心開幕,上海市委書記李強在開幕式上致辭。圖自上觀新聞
一、政策:全球主要國家和地區均高度重視
以AlphaGo(阿爾法圍棋)事件爲分水嶺,人工智能獲得了空前的關注,主要國家和地區紛紛加入這場事關未來大國科技實力的競爭當中。因爲基礎設施尚未普及、技術超前、理論分支衆多等,人工智能的發展經曆過三次潮起潮落,直到2016年DeepMind(深度思考)公司研發的AlphaGo挑戰世界頂尖圍棋選手李世石,並獲得最終勝利,才讓全球重新感受到人工智能所帶來的魅力。AlphaGo在人機大賽中表現出的與人類相似甚至更勝一籌的觀察、思考、決策能力,吸引了世界各國和地區著手並加強人工智能領域的研發。據不完全統計,目前全球包括美國、中國、歐盟、日本、韓國、印度、丹麥、俄羅斯等近30個國家和地區發布了與人工智能相關的戰略規劃和政策部署。
其中,約80%的國家在2016年之後密集發布相關政策和官方計劃,例如美國《國家人工智能研究與發展戰略規劃》,英國《機器人技術與人工智能》,中國《“互聯網+”人工智能三年行動實施方案》等。
從發布的政策規劃來看,各國和地區認同人工智能對未來的人才、産業升級、社會福祉、全球影響力的重要性,並作爲國家級戰略進行推進。根據各國科研實力、人才彙集程度、基礎設施完備度、國情等因素,各國和地區的側重點有所不同。
美國致力于維持全球科技霸主地位,人工智能位于其科技版圖的核心。從奧巴馬時期到特朗普時期,美國一直積極支持人工智能的研究,並將政策態度從“引導和扶持”轉爲“必須領先”。2019年,美國陸續頒布《維護美國在人工智能領域領導地位》《國家人工智能研發戰略計劃》《美國人工智能時代:行動藍圖》三部重要政策,表現美國政府對人工智能技術的高度重視和維持領先地位的決心,主要措施包括:加強聯邦政府資助,美國認爲政府資金支持是參與推動科研進步的重要環節,但官方資助力度逐漸減弱,1976—2018年,聯邦政府的研發支出占GDP比重從約1.2%下降爲約0.7%;此外,通過減稅來鼓勵企業加大研發投入;發揮硅谷創新力量,建立包括計算機視覺、語音語義、開源框架平台等在內的技術和産業生態鏈;重視以芯片爲主的硬件層,包括促進國內半導體制造産業、建立多邊出口管制、保護供應鏈等;重視全球性人才,包括對國內人才的培育和國際人才的吸引,認爲有必要簡化相關人才的H-1B工作簽證申請程序;加強合作,包括國內外組織研發中心或聯合實驗室、舉辦創新比賽等;開展前沿技術研究。
歐盟重點關注工業、制造業、醫療、能源等領域,強調發揮創新創造力,應用人工智能使制造業及相關領域智能升級。與美國類似,歐盟較早對人工智能進行研發,並通過頒布政策、扶助資金、推出國家級計劃、建立重點科研實驗室等行爲支持人工智能技術和産業發展,例如2018年頒布的《人工智能合作宣言》。此外,作爲“數字歐洲”計劃和“地平線2020”計劃中的重要環節,人工智能相關項目也將接受數十億歐元的投資。首先,與美國對比,歐盟更加重視人工智能的道德和倫理研究,並在多份文件中表明人工智能發展需要符合人類倫理道德,例如2020年3月頒布的《走向卓越與信任——歐盟人工智能監管新路徑》明確提出,爲解決能力不對等和信息不透明問題,保障人民相關權利,需要建立人爲監督的監管框架,重視數據安全和隱私保護。其次,歐盟對人工智能的應用側重更細化,不同于美國的全方位領先,歐盟希望借助自身在制造業、工業、汽車等領域的優勢,利用人工智能技術進行産業強化升級,例如頒布《通往自動化出行之路:歐盟未來出行戰略》。
日本由于面臨嚴峻的少子化與老齡化問題,著重研究人工智能在機器人、醫療、汽車交通等領域的應用。
如圖5.2所示,日本生育率長期低迷,老齡化水平長期位居世界第一。1992年日本勞動年齡人口占比見頂,2008年日本人口總量見頂,這對日本經濟和社會發展産生了深遠的負面影響,日本面臨著例如養老、健康等問題的挑戰。在這一背景下,人工智能被認爲是日本經濟增長的“第四次産業革命”,以2016年發布的《日本下一代人工智能促進戰略》爲起點,不斷推出相關政策規劃,圍繞“基礎研究、應用研究、産業化”三個方面,其中日本總務省下設的信息通信技術研究所和文部科學省進行人工智能理論和技術研發,經産省解決應用場景問題,經産省建立的人工智能研究中心促進産學研合作,主要承擔成果轉化和推廣。
中國人工智能呈三階段逐步推進,重視與制造業和服務業的融合。自2015年起,我國人工智能相關政策從智能制造時期、“互聯網+”時期(以《“互聯網+”人工智能三年行動實施方案》爲代表),到“智能+”國家戰略時期(以《新一代人工智能發展規劃》爲代表)演變。政策重心從核心技術攻克到實際場景應用,從特定行業到跨界融合,從單項技術到人機協同。與美國和歐盟類似,我國也強調建立相關試點項目,包括技術示範試點、政策試驗、社會實驗。
二、基礎科研:美國最強,中國快速追趕
中國人工智能領域論文數量增長較快,但論文質量與美國依然存在差距。如圖5.3所示,全球累計發布人工智能論文超過70萬篇,中美兩國是論文發表大國,2018年中美兩國分別發表論文2.5萬篇和1.6萬篇,合計占全球比重達46.5%。從增長趨勢來看,美國保持勻速增長,中國自2014年後增長較快,中國論文數量占全球總量比重從1998年的8.9%上升爲2018年的28.2%。從代表論文質量的FWCI(平均加權引用影響)指數來看,如圖5.4所示,中國論文質量也在穩步提升,從1998年的0.43提升至2018年的1.39。美國保持全球最高水平,長年保持在2左右,2018年FWCI指數達2.38。
從論文發表機構類型來看,包括中國、美國、歐盟27國等在內的各國和地區均以高校爲核心科研力量,2018年三者高校論文産出占各自總産出的92.1%、84.6%、90.7%。除高校外,中美兩國的主力科研主體有所不同。如圖5.5所示,2018年中國科研機構産出約爲中國企業産出的3倍。如圖5.6所示,同期美國企業産出約爲美國科研機構産出的1.6倍。
三、數據量:人工智能時代的“原材料”,中國具有規模優勢
電腦和智能手機的普及、互聯網和移動互聯網所累積的數據爆發,是促進人工智能技術和應用突破的重要原因之一。人工智能需要做到“感知、思考、決策”,首先就需要足夠多、足夠好的原始數據對計算機進行訓練,猶如培育良駒,必須餵足新鮮的牧草。“足夠多”代表數據的數量要多,電腦的發明使運算簡化,並讓信息以電子化形式保存,智能手機的普及使全球網民滲透率大幅提高,兩者令大量的數據被保存。“足夠好”代表數據的質量要佳,互聯網的誕生極大地縮短了信息交流的物理距離,提高了傳播速度,各類互聯網類服務應用程序誕生,其産生的數據類型也更加多樣,包括浏覽網頁喜好、外賣點單頻率、行程記錄等,只有多元豐富的數據才能應對各種訓練人工智能的要求。數據增長和應用依賴于信息及物理的基礎設施構建,中國將成爲全球最大的數據中心。得益于人口數量、互聯網滲透率、智 能手機滲透率、網速等因素,如圖5.7所示,2018年中國擁有數據量7.6ZB,占全球數據總量的23.4%。隨著5G、物聯網等的發展,通信設備接入數量和承載能力的提高,終端消費者的增多,預計中國的數據量將在2025年達48.6ZB,占全球數據總量的27.8%(見圖5.8),成爲全球最大的數據集中地,這將極大地促進和豐富人工智能訓練,相關模型結構和結果也會更精准。
四、技術:深度學習推動本次人工智能熱潮
足夠多、足夠好的數據支撐人工智能“感知”階段,而人工智能算法使計算機擁有思維,從而達到“理解、決策”,深度學習在此過程中做出了巨大貢獻。深度學習是一類模式分析方法的統稱,計算機通過學習樣本數據來掌握內在邏輯和規律,從而擁有分析能力,這項研究最早可以追溯到1958年弗蘭克·羅森布拉特發明的感知機(Perceptron)。利用感知機,可以進行圖像區分訓練,例如,最常見的是從水果堆中選出“蘋果”或者“香蕉”。然而由于當時缺少足量的數據,該項研究陷入瓶頸,並出現過度擬合(Overfitting)問題。例如學生希望通過練習相似的題目來掌握一種題型,但是訓練量不夠大,學生並沒有理解題型背後的知識點,因此試題一旦發生些許變化,學生便無法解出答案。後來,科學家通過研究人腦,試圖模仿腦神經網絡機制來進行圖像、聲音等分類工作,逐漸演化成如今的深度學習(見圖5.9)。
深度學習的發展推動了人工智能基礎應用技術的突破,自2010年起,全球包括計算機視覺、語音語義等基礎應用技術的專利申請量急速增長。
計算機視覺技術主要是讓計算機擁有人類的眼睛,學會“看”圖片、文字、視頻等,經常用于圖像識別、人臉識別等,適用于自動駕駛、安防、人臉支付等領域。從計算機視覺和圖像識別相關的技術申請情況來看,截至2018年12月31日,全球共申請14.3萬項同族專利,中國、美國、韓國成爲全球申請數量排名前三的國家,分別爲5.3萬項、2.4萬項、2.3萬項。從技術授權情況來看,美國技術授權量全球最高,達1.3萬項,日本和中國排名爲第二、第三,分別爲1.04萬項和1萬項。從申請人來看,佳能、東芝、三星爲前三位申請人,申請數量分別爲2900項、2700項、2300項。
語音語義技術主要是讓計算機學會“聽、讀”文字、段落、文章等,經常用于文字識別、語音情感分析、人機對話、聲音定位等,適用于翻譯軟件、車載操作系統、智能音箱、語音助手等領域。從語音語義技術相關的技術申請情況來看,如圖5.10所示,截至2019年12月20日,全球共申請4.3萬項專利族,中美兩國依然是這個領域的主要申請國,合計占比超過75%。從申請人來看,如圖5.11所示,截至2019年12月20日,語音語義領域的申請人以企業爲主,其中IBM(美國國際商用機器公司)、三星、微軟爲前三位申請人,申請專利量分別爲1741項、890項、821項。從專利授權人來看,微軟、IBM、Nuance(一家領先的語音和語言理解解決方案提供商)爲前三位授權人,授權量分別爲672項、468項、440項。從國內企業情況來看,百度成爲唯一一家在語音語義技術領域申請量和授權量均位列全球前十的企業,分別排名第五和第八。
中國人工智能領域的專利申請量呈逐年上升趨勢,根據國家工業信息安全發展研究中心《人工智能中國專利技術分析報告》數據,2018年國內專利申請量達94539件,爲2010年申請量的10倍。截至2019年10月,百度、騰訊、微軟、浪潮、華爲分別以5712、4115、3978、3755、3656件專利申請量位列國內人工智能專利申請量前五。
人工智能芯片的出現顯著提高了數據處理速度,支撐了日益複雜的算法處理龐雜數據,是人工智能發展的重要基礎。隨著處理的數據量增多,從通用場景到各類特定場景,算法模型設計的框架和層數也越來越複雜,這對基礎硬件提出了更高的運算要求。從相關專利申請 情況來看,中美兩國是申請大國,如圖5.12所示,截至2019年10月,中美兩國人工智能芯片專利申請量分別爲1.6萬項和1.1萬項。從相關申請人來看,傳統芯片和半導體企業更有優勢,其中三星、日立和IBM是該領域的前三位專利申請人,從近年申請趨勢來看,三星和英特爾表現得更積極。從實際應用産品來看,如表5.1所示,目前較典型的有英特爾EyeQ系列、英偉達Xavier系列、華爲昇騰310、寒武紀Cambricon 1M系列、百度昆侖芯片等。
中美兩國是全球人工智能企業的聚集地,中國企業集中于應用層,美國企業集中于技術層。截至2019年2月,全球共有人工智能企業3438家。美國以1446家位列第一,全球占比42.1%。中國以745家位列第二,全球占比21.7%。從企業類型來看,如圖5.13所示,中國主要爲應用層企業,美國主要爲技術層企業。中國應用層人工智能企業占比最高,爲75.2%;技術層居第二位,占比爲22%;基礎層企業占比最少,僅爲2.8%。而美國更重視技術研發,基礎層、技術層、應用層這三類企業占比分別爲39.1%、57.7%、3.2%。
五、資本:全球投資持續上升,中美兩國人工智能企業最受資本青睐
人工智能技術突破和政策支持吸引資本持續投入,過去10年平均投資年增速約爲50%。根據斯坦福大學數據,全球對人工智能初創企業投資金額從2009年的不到10億美元升至2019年的近400億美元,其中從2014年開始投資加快,2014—2019年11月,全球人工智能初創企業共獲得1.6萬筆投資,平均每筆投資金額約860萬美元。
從國家和地區來看,如圖5.14所示,2018年1月—2019年10月,美國公司和中國公司是全球投資重點。由于美國的技術領先性,美國無論是被投資金額還是被投資企業數量均爲世界第一。盡管中國被投企業數量不及美國,但由于每筆投資金額較高(例如,曠視科技2018年3月C輪融資4.6億美元,商湯科技2018年4月C輪融資6.2億美元),中國初創企業被投資金額僅次于美國,約爲250億美元。此外,英國、以色列、加拿大、法國、日本、新加坡、德國和印度是被關注較多的國家和地區。
任澤平、馬家進、連一席:《新基建》,中信出版社2020年6月版。
本文系觀察者網獨家稿件,文章內容純屬作者個人觀點,不代表平台觀點,未經授權,不得轉載,否則將追究法律責任。關注觀察者網微信guanchacn,每日閱讀趣味文章。