1. 邁向雲-邊-端融合的機器人 4.0 時代
1.1. 數字經濟的基礎設施和發展趨勢
近年來,數字經濟正在席卷全球,全球經濟向數字經濟遷移已經勢在必然,數字經濟已經成爲國家的核心競爭力。據上海社科院測算,2016 年到 2018 年,中國數字經濟對 GDP 增長的貢獻率分別達到了 74.07%、57.50%和 60.00%。預計 2019 年中國數字經濟增長仍將占到62.50%[1]。
數據成爲驅動經濟增長的核心生産要素。大數據和雲計算等技術的融合,推動了物聯網的迅速發展,實現了人與人、人與物、物與物的互聯互通,導致數據量呈現爆發式增長。數據如同農業時代的土地、勞動力,工業時代的技術、資本一樣,已成爲數字經濟時代的生産要素,而且是核心的生産要素。數字技術出現後,網絡和雲計算成爲必要的信息基礎設施。隨著數字經濟的發展,數字基礎設施的概念更廣泛,既包括了信息基礎設施,也包括了對物理基礎設施的數字化改造[2]。
近年來,移動互聯網、大數據、雲計算、物聯網、人工智能等信息技術的突破和融合發展促進了數字經濟的快速發展。數字經濟驅動未來,數字經濟成爲經濟社會發展的主導力量。作爲硬科技代表的機器人行業,將利用數字經濟中的技術紅利加速機器人的落地。人工智能、5G 通訊、計算的模式等都對機器人領域有著潛在而巨大的貢獻。
1.2. 機器人技術發展主要階段分析
2017年,中國信息通信研究院、IDC 國際數據集團和英特爾共同發布了《人工智能時代的機器人 3.0 新生態》白皮書[3],其中把機器人的發展曆程劃分爲三個時代,分別稱之爲機器人1.0、機器人 2.0、機器人 3.0。
機器人 1.0(1960-2000),機器人對外界環境沒有感知,只能單純複現人類的示教動作,在制造業領域替代工人進行機械性的重複體力勞動。機器人 2.0(2000-2015),通過傳感器和數字技術的應用構建起機器人的感覺能力,並模擬部分人類功能,不但促進了機器人在工業領域的成熟應用,也逐步開始向商業領域拓展應用。機器人 3.0(2015-),伴隨著感知、計算、控制等技術的叠代升級和圖像識別、自然語音處理、深度認知學習等新型數字技術在機器人領域的深入應用,機器人領域的服務化趨勢日益明顯,逐漸滲透到社會生産生活的每一個角落。在機器人 2.0 的基礎上,機器人 3.0實現從感知到認知、推理、決策的智能化進階。
1.3. 應用領域分析和大規模商用的難點
當前,全球機器人市場規模持續擴大,工業機器人市場增速穩定,服務機器人增速突出。2018 年,全球機器人市場規模達 298.2 億美元,2013-2018 年的平均增長率約爲 15.1%[4]。在裝備制造領域,機械臂憑借強大的負重能力和精准的抓取操作代替著工人的雙手;在物流領域,智能倉儲機器人和無人搬運車不斷提高著運輸效率;在生活服務領域,家用清潔機器人和服務機器人正成爲許多家庭的私人保姆和小秘書。
工業制造領域分析
目前,工業機器人在汽車、金屬制品、電子、橡膠及塑料等行業已經得到了廣泛的應用。隨著性能的不斷提升,以及各種應用場景的不斷清晰,2013 年以來,工業機器人的市場規模正以年均 12.1%的速度快速增長,預計到 2020 年將達到 230 億美元的銷售額[4]。隨著人力成本的上升,工業制造領域的應用前景良好,將會保持快速增長的勢頭。同時,工業機器人需要擁有更高的靈活性、更強的自主避障和快速配置的能力,提高整體産品的易用性和穩定性。
消費服務領域分析
服務機器人雖然整體銷售額低于工業機器人,但近幾年一直維持著較高的年增長率,商用服務機器人在商場、銀行、酒店、機場等應用場景有了更多的落地部署,主要提供導覽、問詢、送物等基礎服務。同時,家用服務機器人悄然進入千家萬戶,掃地機器人銷量在家用服務機器人銷量中占主要份額,成爲目前家務機器人中的主導品類。由于本體能力不足,隱私、安全方面的問題,家庭管家機器人和陪伴型機器人的市場滲透率較低。2013 年以來全球服務機器人市場規模年均增速達 23.5%,預計 2020 年將快速增長至 156.9 億美元[4]。
從整個技術發展和市場環境看,機器人産業擁有以下發展推力:
a、成熟的生態系統
b、老齡化人口趨勢和新興市場
c、更多智能産品互聯和智能家庭建設吧
b、人工智能、自然語言理解能力的增強
大規模商用的難點
在以上幾點的助推下,機器人産業會繼續快速發展,但要達到大規模商用,還有很多難點需要解決。
首先,機器人目前的能力不能滿足用戶期望,缺少關鍵場景。得益于人工智能帶來的紅利,近年來機器人感知能力提升明顯,可以通過視覺進行人臉識別,做語音交互。但是要真正替代人類的勞動時間,做一些實際工作,機器人除了要具備感知能力,還要能夠理解和決策。機器人需要有記憶、場景理解的能力,擁有知識,才能夠優化決策,自主實施工作,並進行個性化演進。目前的機器人依然缺少令人矚目和必不可少的應用場景,大部分人對于在家中擁有一個機器人沒有很高的興趣。在機器人提高自身能力,完成特定和複雜問題之前,這一比例將維持低水平。
其次,價格高,不成規模。傳感器和硬件的價格一直在下降,但是機器人的價格依然很高,不能被廣泛的市場用戶接受,沒有形成市場規模。掃地機器人由于較低的價格,目前快速的進入大衆家庭。但是對于大多數類別的機器人,特別是具有更強功能、高精度移動底盤、機械臂的機器人,價格依然是一個痛點。
第三,隱私、安全和數據保護問題亟待解決。隨著機器人的應用領域越來越廣泛,其物理安全和用戶的數據安全問題更加凸顯。在與機器人的交互過程中,機器人會不斷收集用戶的圖像、語音、行動數據進行導航和決策,這些數據有的在本地處理,有的在雲端處理,人們對這些數據的安全抱有疑慮。對于能夠自由移動的服務機器人和擁有機械臂的工業機器人,保證機器人自身的物理安全,不被惡意攻擊,避免造成人身傷害也至關重要。
1.4. 機器人 4.0 的定義和發展機會
機器人 3.0 預計將在 2020 年完成,在此之後,機器人將進入 4.0 時代,把雲端大腦分布在從雲到端的各個地方,充分利用邊緣計算去提供更高性價比的服務,把要完成任務的記憶場景的知識和常識很好的組合起來,實現規模化部署。機器人除了具有感知能力實現智能協作,還具有理解和決策的能力,達到自主的服務。在某些不確定的情況下,它需要叫遠程的人進行增強,或者做一些決策輔助,但是它在 90%,甚至 95%的情況可以自主完成任務。
要達到這一目標,首先需要利用人工智能和 5G 技術。利用人工智能技術提高機器人本體感知能力的同時,提升個性化自然交互能力。利用 5G 技術,大大縮短從終端到接入網的時間,帶寬大幅度上升,很多東西可以放到邊緣端,加入更多的計算能力,包括雲端大腦的一些擴展,助力機器人規模化部署。
類似互聯網的三級火箭發展模式,第一階段——關鍵場景,把握垂直應用,提高場景、任務、能力的匹配,提高機器人在關鍵應用場景的能力,擴大用戶基礎;第二階段——人工增強,通過加入持續學習和場景自適應的能力,延伸服務能力,取代部分人力,逐步實現對人的替代,讓機器人的能力滿足用戶預期;第三階段——規模化,通過雲-邊-端融合的機器人系統和架構,讓機器人達到數百萬千萬級水平,從而降低價格成本,實現大規模商用。
1.5. 白皮書結構說明
本白皮書由英特爾、達闼科技、新松機器人、科沃斯商用機器人共同發布,分爲八章。第一章分析機器人發展情況,並定義機器人 4.0;第二章闡述人工智能和 5G通訊技術推動機器人架構創新,並提出雲-邊-端融合的機器人系統和架構;第三章重點分析機器人 4.0 所需的核心技術;第四章探討雲端大腦和安全專網;第五章討論邊緣智能如何支持多機器人協作;第六章思考服務機器人的場景認知、進化和業務;第七章描述協同創新與合作共贏的關鍵領域和方向;第八章進行總結與展望。
2. 人工智能和 5G 通訊技術推動機器人架構創新
2.1. 人工智能技術演進和應用現狀
人工智能技術的正式提出始于 1956 年,到目前爲止已經取得不少進展。從技術上而言,可以初略劃分爲兩類方法,一類是符號方法,一類是統計方法(支持向量機,神經網絡,深度學習都可以歸爲這一類)。
人工智能的發展可以大致分爲兩個階段,1990 年以前主要是符號方法,包括基于規則,邏輯等。八十年代的基于知識庫的專家系統是這個時期人工智能走向應用的一個嘗試,取得了一定的成果,但也很快顯現了這類方法的問題,比如相對開放領域的知識庫很難建立完整(尤其是常識知識很難表示完全),知識庫增大後知識推理的組合爆炸,缺乏學習能力等問題。上世紀 90 年代開始,統計方法開始盛行,取得了不少的進展,包括支持向量機等機器學習方法,並廣泛應用于語音識別,自然語言處理,計算機視覺,數據挖掘等領域。從 2012 年開始,深度學習方法在計算機視覺,語音識別方面取得了較大的突破,不少任務的性能在大規模數據集上面得到大幅度提升。人工智能尤其是深度學習方法已經在不少領域開始廣泛應用,包括語音識別,人臉識別等,作爲機器人 3.0 的核心技術,在機器人的應用中起到了重要的作用。近年來人們發現了困擾傳統機器學習方法的一些問題,如魯棒性、可解釋性,小數據學習在深度學習方法的框架下仍然沒有得到解決。
總體說來,人工智能技術 60 多年來取得了不少的突破,但也存在不少亟待解決的問題。人工智能之父明斯基在發布他的新書之前發表的一篇論文[5]也深刻地指出,目前人工智能的進展低于他的期望,其中一個主要原因是主流的方法(符號方法,統計方法或更細分的方法)都是想基于單一方法來解決人工智能問題,而真正的人類智能則是有機地結合了多種方法並進行選擇應用的結果,未來的人工智能需要走這個方向才能進一步突破。機器人領域的應用對人工智能提出了尤其更高的要求,這也就需要在人工智能領域取得更多的突破。
2.2. 5G 通訊技術的演進和應用現狀
5G 是第五代移動通信技術的簡稱,5G 標准自 2016 年在 3GPP 正式開始立項,于 2017 年12 月完成了 5G R15 非獨立組網的標准制定,支持在 4G 網絡下同時部署 5G 網絡,並于 2018年 6 月完成了 5G R15 獨立組網的標准制定。目前 5G 在各個國家開始了實驗性部署。在國內,三大運營商從 2018 年開始 5G 實驗網的測試,2019 年已經在部分城市完成了在 sub-6Ghz 頻段以下的 5G 規模測試。5G 實驗網峰值速率可以達到 10Gbps,在密集部署城區平均速率達到了100Mbps,在低時延模式下,5G終端和基站傳輸時延達到 1毫秒以內,滿足了 ITU最初制定的5G 需求[6]。2019 年 6 月,國內正式發布了 5G 的牌照,中國移動、中國聯通、中國電信和廣電開始了商用部署。4G 技術從 2008 年 3GPP release8 標准完成到 2013 年 4G 牌照的發布用了 5 年時間,5G 從標准完成到牌照的發布只用了一年,凸顯了國內 5G 發展的迫切和重要。
除了網絡傳輸能力的提升,5G 還制定了非常靈活的空中接口和核心網標准,增強了對不同業務支持的能力,相對于 4G 以移動寬帶(MBB)爲主的應用,5G 的應用領域進一步加強移動寬帶業務(eMBB),比如高清/全景視頻,移動 VR/AR 等等,同時 5G 的應用拓展到海量連接的物聯網(mMTC)和高可靠低時延(URLLC)的業務。URLLC 的業務包括車聯網、自動駕駛、遠程醫療、工業自動化等應用。國內的 5G Sub-6Ghz 頻段部署, eMBB, URLLC,mMTC 應用都可以得到很好的支持。在高頻段,比如 28GHz 左右,目前在國內還在實驗階段,高頻段將主要支持 eMBB應用。對于雲端機器人應用,既有時延和可靠性要求不高的應用,比如數據備份、訓練數據的采集等等,也有實時視頻傳輸交互,還有對時延和可靠性要求非常高的機器人的運動控制、遠程操控等等。這些應用,可以在 5G 網絡上,通過靈活的配置得到更好的支持。
對于 5G 的應用,其最初的商用部署是針對 eMBB 業務,比如 5G 的手機等等,由于標准和網絡設備的複雜性,5G 設備和網絡的功能會根據需求演進。如果 eMBB 模式不能完全滿足需求,就需要積極和運營商、設備商溝通、合作,推動對該業務的支持。同時 5G 的 標准也在不斷的演進,目前 5G R16 版本的標准正在制定過程中,計劃將于 2019 年底完成。R16 版本將包含對 5G 網絡效率的提升和應用的增強,比如對車聯網、工業 IoT 和 URLLC 業務的增強。5G 網絡的持續演進將進一步增強網絡的能力和靈活性,滿足機器人 4.0 的雲-邊-端的更高的互聯要求。
2.3. 雲端大腦對機器人能力的增強
2010 年提出的雲機器人概念引入了雲端大腦,機器人嘗試引入雲計算、雲存儲及其它雲技術,達到機器人融合基礎設施和共享服務的優點[7]。相比于獨立的機器人本體,連接雲端大腦後的機器人擁有以下四個核心優勢。
信息和知識共享:一個雲端大腦可以控制很多機器人,雲端大腦可以彙集來自所有連接機器人的視覺、語音和環境信息,經雲端大腦智能分析處理後的數據信息可以被所有連接機器人使用。利用雲服務器,各機器人本體獲取和處理的信息可以保持最新,並安全備份。
平衡計算負載:一些機器人功能需要較高的計算能力,利用雲端平衡計算負載可以降低機器人本體的硬件需求,在保證能力的同時,讓機器人更輕、更小、更便宜。
協同合作:通過雲端大腦,機器人本體不再獨立工作,多機器人可以協同工作,例如共同搬運貨物,配合完成一整套工作流程等。
獨立于本體持續升級:借助雲端大腦,機器人可以獨立于本體持續升級,不再依賴于本體硬件設備。
2.4. 邊緣計算對機器人服務的提升
IoT 應用的快速發展,使得大量數據在網絡邊緣産生,推動了邊緣計算的産生和發展。邊緣計算的提出始于 4G 時代,將計算和存儲資源部署到網絡邊緣,不僅可以減少核心網和互聯網上的流量,還可以顯著降低傳輸時延,提高網絡可靠性。
低時延的業務需要終端、移動蜂窩網(接入網和核心網)、互聯網、數據中心的端到端的保障。目前的測試結果表明 5G 手機和基站的數據通路延時可以達到 4 毫秒,在 URLLC 模式下,手機和基站的延時可以達到 1 毫秒以下,相比 4G 的 20毫秒提高了 20倍左右[6]。對于互聯網和數據中心的時延,一般情況下由于地理位置分布廣和未針對低時延優化,從核心網網關到互聯網數據中心可在幾十到幾百毫秒之間。在 5G 中,其核心網引入了分布式網關,網關可以下沉到基站附近,邊緣服務器可以直接連接到分布式網關上,大大降低網絡的端到端時延。
邊緣計算的引入將解決終端能力受限和雲計算的實時響應的問題,增強機器人雲端大腦的實時響應能力,對于滿足機器人 4.0 的要求十分關鍵,比如實時的推理、場景理解、操控等等。邊緣計算和雲計算的結合,將突破終端的計算能力和存儲的限制,提高 AI 算法的訓練和推理能力,比如提升精度和降低訓練時間。同時將大部分機器人的智能布署在邊緣和雲端,通過協作和不斷的訓練,持續不斷的提高機器人智能,比如通過邊緣計算能更好的支持實時的多機協作,支持實時的知識圖譜提取、理解和決策,持續不斷的提高機器人的智能。邊緣計算和雲計算還可以解決機器人終端升級維護的困難,在機器人本體的生命周期內不斷升級,提高機器人的能力,增強數據安全和隱私保護,充分利用摩爾定律帶來的性能提升。
2.5. 雲-邊-端一體化對機器人系統的支撐
雲-邊-端一體化構建了一個通過機器人提供多樣化服務的規模化運營平台。其中,服務機器人本體是服務的實施者,而實際功能則根據服務的需要無縫地在終端計算(機器人本體)、邊緣計算和雲計算之間分布和協同。機器人系統類似現在智能手機上的各種 APP,主要關注如何實現高性價比的多模態感知融合、自適應交互和實時安全計算。
多模態感知融合:爲了支持機器人的移動、避障、交互和操作,機器人系統必須裝備多種傳感器(如攝像頭、麥克風陣列、激光雷達、超聲波等)。同時,環境裏的傳感器可以補足機器人的物理空間局限性。大部分數據需要在時間同步的前提下進行處理,並且調用不同複雜度的算法模塊(例如 SLAM,圖像處理,人和物體的識別等)。機器人硬件系統和邊緣計算需要協同來支持(可能來自多個機器人的)多傳感器數據同步和計算加速,因此應該采用能靈活組合 CPU、FPGA 和 DSA (Domain-SpecificAccelerator)的異構計算平台。另一部分沒有強實時性要求的感知任務(如人的行爲識別、場景識別等),可以由雲計算支持。
自適應交互:爲了支持機器人的個性化服務和持續學習能力,需要將感知模塊的輸出與知識圖譜結合對環境和人充分理解,並且逐步提取和積累與服務場景和個人相關的個性化知識。通用知識和較少變化的領域知識應該存放在雲端,而與地域和個性化服務相關的知識應該存放在邊緣或者終端。無論知識存放在哪裏,在機器人系統中應該有統一的調用接口,並可以保證實時通訊。基于 ROS2 構造涵蓋終端和網絡側的軟件系統框架可以滿足未來的需求。
實時安全計算:未來的服務機器人應用將有大量需要實時響應的情形(如語音交互、協同操作等),因此需要在邊緣服務器部署相應的加速硬件。同時,機器人也將處理大量涉及用戶隱私的數據(如視頻、圖像、對話等)。雲-邊-端一體化架構需要構建隱私數據的安全傳輸和存儲機制,並且限定物理範圍。對于可以進行物理操作的機器人,要構建獨立的安全監測機制,保證即使機器人系統被遠程攻擊劫持後也不會造成物理安全損害。
3. 機器人 4.0 核心技術
在機器人 3.0 時代,服務機器人可以做到一些物體識別、人臉識別,在 4.0 時代需要加上自適應能力。因爲用深度學習做物體識別、人臉識別的時候需要很多的數據來源,但是真正到家庭場景時沒有那麽多數據,這就要求機器人必須通過少量數據去建立識別能力,自己去找到不同的位置,不同的角度做訓練。
這些就是機器人 4.0 要做的,首先對三維環境語義的理解,在知道它是什麽的基礎上,把看到的信息變成知識,讓存儲就變得更加合理,而且可搜索,可查詢,可關聯,也可推理。應用層可以根據這個知識和觀測爲現場場景做出智能的提醒,尋找物品,進行行爲檢測。例如,老人要出門,機器人的知識庫告訴他,今天預報要下雨,但是檢測到老人沒有帶傘,然後查詢傘的位置,機器人就可以把傘送到老人手裏。這都是結合內部知識和外部情況所做的決策。
知識圖譜在整個學術界和工業界越來越受到重視。獲得圖靈獎的傑夫∙辛頓教授在加入谷歌的時候就說要建一個知識圖譜給全世界用。阿裏研究院發布2019年的十大技術趨勢[8]裏面也專門提到了知識圖譜的重要性。這是人工智能邁向下一個階段的必由之路,也是必做之事。
總結下來,機器人 4.0 主要有以下幾個核心技術,包括雲-邊-端的無縫協同計算、持續學習、協同學習、知識圖譜、場景自適應和數據安全。
3.1. 雲-邊-端的無縫協同計算
受制于網絡帶寬以及延遲的制約,當前絕大多數機器人 3.0 系統是以機器人本體計算爲主,雲端處理非實時、大計算量的任務爲輔的系統架構。機器人的主要任務可以簡單劃分爲感知、推理及執行三大部分。爲了能夠精准地感知理解環境以服務于人機交互,機器人系統通常集成了大量的傳感器,因而機器人系統會産生大量的數據。比如采用了高清攝像頭,深度攝像頭,麥克風陣列以及激光雷達等傳感器的機器人,每秒鍾可以産生 250MB 以上的數據量。如此海量的數據全部傳輸到雲端處理既不現實,也不高效。因此,需要將數據處理合理地分布在雲邊-端上。
另一方面,完成感知和理解的 AI 算法也非常複雜。機器人所使用的 AI 算法通常需要很強的算力,例如 Faster RCNN 算法在 GPU 上可以達到 5fps 的處理能力,但是 GPU 的功耗達到200W 以上,機器人本體很難承受,從計算成本而言同樣也非常昂貴。雖然機器人本體計算平台的計算能力仍在不斷提高,但是相對于 AI 算法的需求依然有限。爲了完成機器人的計算需求,需要在雲和邊緣側提供算力的支持,以實現在大規模機器人應用場景下,更有效、更經濟的計算力部署。
隨著 5G 和邊緣計算的部署,機器人端到基站的延遲可以達到毫秒級,使得 5G 的網絡邊緣可以很好地支持機器人的實時應用。同時,邊緣服務器可以在網絡的邊緣、很靠近機器人的地方處理機器人産生的數據,減少對于雲端處理的依賴,構成一個高效的數據處理架構。
雲-邊-端一體的機器人系統是面向大規模機器人的服務平台,信息的處理和知識的生成與應用同樣需要在雲-邊-端上分布處理協同完成。例如,彙集來自所有連接機器人的視覺、語音和環境信息,加以分析或重構後,被所有連接的機器人所應用。
因此,在通常情況下,雲側可以提供高性能的計算以及通用知識的存儲,邊緣側可以更有效的處理數據,提供算力支持,並在邊緣範圍內實現協同和共享,機器人終端完成實時的操作和處理等基本機器人的功能。然而由于機器人的業務需求多種多樣,協同計算的部署也不是一成不變的,機器人 4.0 系統還要支持動態的任務遷移機制,合理的根據業務需求將不同的任務遷移到雲-邊-端,實現雲-邊-端的無縫協同計算。
3.2. 持續學習和協同學習
在機器學習方面,機器人 3.0 主要是采用基于大量數據進行監督學習的方法,這也是目前機器學習的主流方法,而在機器人 4.0,還需要加上持續學習和協同學習的能力,才能使得機器人能夠適應更複雜的應用場景。
在 3.0 時代,服務機器人可以做到一些基本的物體識別、人臉識別,但由于機器人應用對感知識別的正確率要求很高,盡管這些方法在別的要求不高的領域已經可以滿足應用需求(例如互聯網搜索有 80%的正確率就夠了),但對于機器人應用而言則遠遠不夠。第一是機器學習所固有的魯棒性方面的問題,深度學習方法也不能幸免,識別結果可能出錯,而且出錯的時候系統也不知道自己錯了,這樣就可能造成服務的失敗和錯亂。例如人需要機器人取東西 A,而機器人卻取了東西 B, 輕則鬧笑話,引起用戶不滿,嚴重的可能會造成對用戶的傷害(比如取錯藥品的情況)。魯棒性的問題是目前所有機器學習方法自身的一個通病,因爲訓練數據中總是存在著長尾數據無法被准確識別,該問題很難通過現有的監督學習方法在部署産品前就解決。第二是數據不足,這也是現實應用中普遍出現的情況,例如用人體特征進行身份識別的時候需要大量的數據(幾百張以上的不同人體姿態、角度的照片),而這些數據又無法事先獲得。總結下來,這兩方面的問題都和缺少數據直接相關。
要解決這些問題必須讓機器人具有自主的持續學習能力。具體說來,機器人可以先通過少量數據去建立基本的識別能力,然後會自主的去找到更多的相關數據並進行自動標注(或通其他方式,例如與人交互來獲得標注,但要注意盡量減少對用戶的打擾)。用這些新的數據來對已有的識別模型進行重新訓練以改進性能,隨著這個過程不斷進行,機器人可以把識別的性能不斷提高。具體拿物體識別來說,機器人應該先通過少量數據來建立對該物體的基本識別能力,然後可以自己去找到不同的位置,不同的角度做訓練,不斷提高對這個物體的識別精度,在一段時間的持續學習後達到接近 100%,一個初步實現參見文獻[9]。
在實際應用中,一個機器人能接觸到的數據是有限的,其持續學習的速度可能會受到限制。機器人 4.0 是一個雲-邊-端融合的系統,如果能夠在機器人間或機器人與其他智能體間通過這個系統來共享數據、模型、知識庫等,就能夠進行所謂的協同學習[10]。通過雲端的模擬器來進行虛擬環境中的協同學習也是一種行之有效的方法,可以充分利用雲的大規模並行處理能力和大數據處理能力。協同學習使得機器人的持續學習能力進一步增強,可以進一步提高學習的速度和精度。
3.3. 知識圖譜
知識圖譜在互聯網和語音助手方向已經開始較爲廣泛的應用,尤其是百科知識圖譜。機器人也有百科知識問答類的應用場景,對于這類的知識圖譜可以直接加以應用。但不同于通常的百科知識類的知識圖譜,機器人應用的知識圖譜有一些不同的需求:
(1)需要動態和個性化的知識。機器人往往需要對所在的環境和人進行更深入的理解才能進行更好的服務,而且不僅僅是當前的情況,要對過去發生的一些情況進行記錄(例如要了解老人通常什麽時候起床,某個物體一般放在什麽位置)。因此,機器人需要記錄環境裏不同時間的人和物、發生的事件等相關信息,這些都是通用知識圖譜所不能事先提供的,必須在環境裏去獲取。這些動態的個性化知識能很好的對人進行個性化的服務,例如通過對某用戶的觀察,機器人可以觀察到該用戶的一些喜好,或者一些行爲模式,這些信息可以幫助對該用戶提供更好的服務。
(2)知識圖譜需要和感知、決策緊密結合, 並幫助實現更高級的持續學習能力。從人工智能發展的曆史看,單一方法很難徹底解決 AI 問題,前面的介紹也提到不論符號方法還是統計方法都已經顯現了瓶頸,而且目前在單一方法裏都沒有很好的方法解決這些瓶頸問題。按照明斯基的分析[5],未來需要多種方法結合的 AI 系統。從最近幾年的研究進展看,這也是未來人工智能取得進一步突破的必經之路。所以不同于以往知識圖譜和計算機視覺等統計方法基本是獨立運作的做法,知識圖譜必須和感知決策更深入、有機的結合。具體來說,知識圖譜的信息是從感知中獲取的,通過基礎的感知,加上場景理解,獲得的信息可以存入知識圖譜,然後這些知識可以進一步進行模式的挖掘(比如時間空間相關的模式)來獲得更高層的知識。知識圖譜的一些知識又可以作爲環境上下文信息提供給感知算法來進行連續學習,從而實現自適應的感知算法。從某種意義來說,這已經不是傳統意義上的純符號方法的知識圖譜,而是一種混合的知識圖譜,即符號方法和統計方法結合的知識圖譜。這也是未來很有潛力取得突破的一個方向。
由于雲-邊-端融合的需要,知識圖譜會分別存放在機器人側,邊緣側和雲側,其接口可以采用統一的接口以利于系統對知識圖譜進行統一的調用。由于協同學習和實時處理的需要,知識和其他相關信息(如數據,模型等)還可以通過雲側、邊緣側來進行共享,通過一定的冗余備份來達到更高的實時性。這類似于計算機架構中的高速緩存機制(Cache), 比如部分存儲在雲端的知識經常被調用,可以緩存到邊緣端或機器人端提高其存取的速度。在 5G 網絡下,延遲本身不是大問題,主要考慮更充分的利用邊緣端和機器人端的計算能力,達到整體資源的最優利用。
3.4. 場景自適應
有了持續學習和知識圖譜, 系統在感知方面的魯棒性大大提高,也在場景分析方面獲得了豐富的信息並存在知識圖譜中,這就使得機器人能夠根據當前的場景進行相應的行動。
場景自適應技術主要通過對場景進行三維語義理解的基礎上,主動觀察場景裏人與物的變化,並預測可能發生的事件,從而産生與場景發展相關的行動建議。例如在養老/助老應用中老人端著一碗湯走向冰箱,機器人可以通過以往的經驗或知識預測老人是要去開冰箱放東西,就可以幫老人打開冰箱。再例如,機器人看到地上有一塊果皮,預測可能會導致老人摔倒,這時機器人可以主動撿起果皮(機器人配備了手臂操控的情況下)或站到果皮邊並警告老人。
這部分的關鍵技術是場景預測能力。場景預測就是通過對場景裏的人、物、行爲等的長期觀察,並結合相關的知識和統計模型來總結出一些個人偏好或行爲模式,並據此來預測目前場景要發生的事件。過去人工智能的符號方法中框架、腳本表示在這裏可以作爲知識表達的形式,但更關鍵的是需要把符號方法和統計方法結合起來,從而解決以往單獨用符號方法無法解決的問題(比如缺少學習能力)。這部分的研究還處于比較初期的階段,但相信在基于持續學習、知識圖譜等技術充分結合的基礎上,該方向在未來幾年會有較大的突破。最終使得整個機器人的閉環系統,即感知-認知-行動,變得更加智能和人性化。
雲端融合在這裏起到非常重要的作用,尤其是知識的共享方面。例如前面的水果皮的例子,這方面的模式可能發生的不多,在單個機器人的情況下可能從來沒見過這個情況,也就無法知道是危險的。如果通過雲-邊-端融合,只要有一個機器人看到過這個危險情況的發生,就可以把該知識分享給所有的機器人,所有的機器人就可以去預測這些危險情況了。除了通過在實際的物理世界中觀察,在雲端通過大規模的模擬來預演生活中可能發生的情況,可能也是另外一個有效的方法來獲得更多的事件模式。
3.5. 數據安全
由于機器人配備了多種多樣的傳感器,在工作過程中可以搜集到很多的信息,包括視覺數據,語音數據,位置數據等,這些重要的隱私數據都需要得到保護。在機器人處于雲-邊-端融合的環境中,數據的處理根據需求會發生在機器人側,邊緣側或者雲側,在網絡受到攻擊的情況下,保護用戶的隱私數據的安全變得尤其重要。一方面可以通過數據脫敏的手段來消除隱私性;但是從根本上而言,雲-邊-端融合的機器人系統需要完整的數據安全保障機制,既要求保證端到端的安全傳輸,也要保障在服務器端的安全存儲。在機器人側,傳感器數據安全地傳輸到可信計算單元,以及控制命令安全地傳輸到執行單元尤其重要,只有確保輸入輸出的安全,才可以確保機器人在受到網絡攻擊的情況下,也能保證機器人物理安全的邏輯得到正確的執行。因此,在機器人側,需要構建一個從傳感器和執行器到可信計算單元之間的可信傳輸通道。
除了原始的隱私數據外,通過用戶數據推理得到的個性化知識也包含了用戶的隱私信息,同樣需要得到安全的保障。在雲-邊-端融合的環境下,機器人側,邊緣側以及雲側的數據安全需求不同,因此需要不同的安全保障機制。在機器人本體方面需要保證重要的隱私數據的物理安全和安全相關應用的代碼安全,網絡側和邊緣端需要對用戶的數據,以及根據用戶數據推理得到的隱私信息做好保護,只有被授權的用戶才可以得到訪問權。盡量避免敏感數據上傳到雲端,存儲在雲端的數據需要提供安全存儲鑒別機制。
4. 雲端大腦和安全專網的實踐與思考
4.1. 雲端智能機器人架構
爲了讓機器人具備通用智能,包括類人的感知和認知能力,類人的動作行爲和類人自然交互能力,並同時最大限度地保障機器人的運行安全,需要構建類人“大腦”的智能體。目前機器人本體計算能力有限,必須通過可以無限擴展的雲端計算能力來提供智能機器人所需的能力。通過無線5G通信網絡和一個安全高速骨幹網絡構成機器人“神經網絡”,實現機器人本體和雲端大腦的連接。雲端大腦包括機器人視覺系統、對話系統、運動智能和極限現實系統等技術,其通過人工智能算法不斷訓練進化,使得前端機器人本體智能隨之迅速提高。因此,采用雲網-端結合的智能機器人系統架構,具有更強的適應性和擴展性,如圖 5 所示。
達闼科技提供的機器人雲端智能大腦,利用深度學習、強化學習和遷移學習技術,通過物理和虛擬平行智能平台,以及多模態 AI 能力,讓機器人的智能快速向人類智能彙集。必要時刻的人類幹預確保了 AI 決策的安全性和可控性。極限現實系統借助流行的遊戲引擎,有助于利用大量的遊戲開發者進行環境的建設。
爲了讓機器人更加智能,更好的爲人類提供服務,雲端智能機器人不再是可以和人類簡單對話、唱歌、跳舞的娛樂工具,而是需要在實際應用場景中幫助人們完成多種特定的任務,包括抓取目標物體、移動到指定位置等。具備這種雲端大腦的新型雲端智能機器人將可滿足各種服務性行業(如醫院、銀行、營業廳、迎賓接待、教育等),以及家庭保姆服務等不同場景的需求。支撐機器人在營業廳 VIP 室端茶送水,在養老院與老人聊天、下棋、陪護、護理,在家中做飯、打掃、與人溝通、照看老人小孩以及陪伴應用場景等。
4.2. 雲端機器人大腦
雲端機器人“大腦”(如圖 5)是由一個可以運行足夠大規模機器人,並面向人工智能服務的平台;包含機器學習、人工智能視覺、自然語言處理和機器人運動智能,以及平行智能體的虛擬空間的綜合智能平台;人類智慧增強的人機融合機器人運營服務平台;和面向各類機器人應用服務的雲端智能開放能力平台四大部分構成。通過雲端將機器人的智能視覺系統、智能語音對話系統、運動智能和極限現實系統等融合起來,形成真正可爲人類服務的智能機器人。該技術架構富有彈性和無限的潛力,機器智能可以在很多應用場景下爲人提供多種應用服務。
雲端智能“大腦”具備提供機器人角色和對應智能技能服務,其中人工智能技能服務提供包括但不限于視覺自主導航和運動、行爲智能(如視覺反饋抓取物體)等智能運動系統,人臉識別、人體識別、2D/3D 物體識別、環境識別、3D 重建/語義分割等智能視覺系統,包括自動語音識別、自然語言理解、情緒識別以及對話知識庫等智能對話系統,以及用來模仿學習和訓練機器人綜合智能的虛擬平行智能平台。通過大規模計算力來構建機器人的大腦中樞系統,通過深度學習、強化學習、模仿學習等 AI 技術,通過物理世界和平行虛擬空間智能融合,以及多模態智能交互,來訓練機器人的通用智能能力。通過機器人身體上的各種傳感器感知真實物理世界,並對物理世界進行三維重建,通過語義分割形成三維環境的高精度語義地圖,讓機器人真正理解當前的物理世界以及客觀物體之間的關系。三維語義地圖同時也構建了機器人數字孿生(Digital Twin)運行的虛擬物理空間,可持續不斷地模擬和訓練各種智能機器人的智能能力。這種雲端智能“大腦”可支持同時爲百萬級實體機器人提供雲端 AI 智能服務,幫助機器人理解物理世界。
人類智慧增強人機融合機器人運營服務平台,在必要的時刻,通過人機無縫融合的方式來支撐雲端機器人規模化商用運行和安全管控服務。人類將直接正向幹預(Human Intelligence),確保人工智能的安全性和決策可控性,在提供無差錯的商用級服務的同時,這些人類的幹預形成強化學習,智能反饋到 AI 訓練系統中,從而讓機器人智能快速向人類智能進化。
4.3. 機器人安全專網的實踐
公衆互聯網中存在大量數據隱私泄露、病毒木馬和漏洞攻擊等問題,如果智能機器人與雲端大腦的網絡通信完全基于公衆互聯網,必將給雲端智能架構帶來極大的安全隱患。爲了提高雲端智能架構與系統的安全性,達闼科技構建了機器人安全專網 VBN(全稱:Virtual BackboneNetwork),機器人本體通過物聯網或移動互聯網就近接入至 VBN 專網接入點,然後通過專網專有線路去訪問雲端大腦,整體網絡架構如圖 6 所示。
達闼科技機器人安全專網疊加在運營商的網絡基礎設施之上,基于運營商的專有線路而不是互聯網線路進行網絡傳輸。作爲雲-邊-端融合機器人系統的神經網絡,它爲機器人和雲端大腦提供安全可靠的網絡連接。達闼科技機器人專網從如下幾個方面加強雲端超融合機器人系統的整體安全性:
(1) 機器人專網 POP點之間的傳輸線路爲點對點 SDH線路或 MPLS VPN專線等專有線路,專網的核心設備不提供互聯網接入,設備和線路均與互聯網物理隔離。只在有互聯網接入需求的站點單獨增加互聯網接入設備,由該設備實現與互聯網對接,但是針對這種場景會增加嚴格的 L3 到 L7 層的安全防護策略以及安全接入認證策略。總體來說,達闼科技機器人專網在物理上實現了與公衆互聯網的隔離,邏輯上則利用虛擬專網技術實現租戶之間的業務隔離,爲最終用戶進一步提升了業務的安全性。
(2) 雲端大腦與機器人專網一體化部署,即雲端大腦部署在機器人專網 POP 點內,或者是通過專有線路與機器人專網互通。機器人只有在接入到專網 POP 點並通過認證後,才能去訪問特定的雲端大腦服務。對于互聯網用戶,雲端大腦完全不可見,這大大降低了雲端大腦被網絡攻擊的風險,提升了系統安全性。
(3) 智能機器人在接入到 VBN 專網時需要更嚴格的准入和認證機制。首先機器人在申請接入之前,相關信息必須在雲端平台登記,必須在經過該平台的注冊和激活後才能申請接入到專網,這樣可以充分提升接入實體的可信性。機器人在接入到專網的過程中,須經過多重認證。對于物聯網接入方式,必須使用定制的物聯網卡,並設置特定的接入點和用戶名密碼,在通過物聯網認證後到達 VBN 專網部署的專用接入網關,在該網關上再做一次認證。爲提升第二次認證的可靠性,集成了 SDP 思想,將區塊鏈技術引入到認證系統中,只有在許可鏈中寫有訪問權限的設備才能發現和訪問 VBN 專網,即使鏈中的部分節點受損或被攻擊,鏈也可以立即隔離這些節點並繼續運行,從而提升網絡認證體系的可靠性。
(4) 智能機器人可能通過物聯網,也可能通過 4G/5G 互聯網接入到 VBN 專網提供的接入點,VBN 專網接入點是和其他網絡(如物聯網、互聯網等)的主要連接點,也可能是系統的主要風險點。除了嚴格的准入和認證機制外,此處會專門部署基于雲的防火牆,該防火牆會基于從 L3 到 L7 等多個層面,針對每個接入租戶或用戶進行安全策略部署,包含但不限于對源和目的 IP 的策略限制、對源和目的端口號的策略限制、對應用層的安全策略等等。通過在 VBN專網的入口處部署高等級的安全管控策略,非法用戶即使是接入到專網後能攻擊的範圍也極其有限,能極大的降低 VBN 專網以及在專網後端運行的雲端大腦被攻擊的風險,從而爲雲端超融合機器人系統的整體安全性提供保障。
未來,雲端智能機器人系統可以把人工輔助監督、記憶知識內容、低頻次的認知類決策神經網絡等功能仍然放在雲端大腦,逐步把視覺識別、語音識別和智能運動等 AI 感知能力,以及需要實時響應的功能模塊放在端側和邊緣計算節點,邊緣計算節點和雲端大腦通過機器人安全專網相連。
雲端智能機器人天然具備移動通信的屬性,它將是 5G 網絡的殺手級應用。5G 網絡爲雲端智能機器人與雲端的網絡連接提供最佳傳輸載體。雲-邊-端智能機器人正在向機器人本體—5G網絡—邊緣計算節點—機器人安全專網和大規模雲端“大腦”的架構發展。達闼科技打造的智能機器人雲端“大腦”,在實施商業化運營和雲端的安全控制的過程中,必然需要依托大帶寬、低時延、超高可靠性、網絡切片和邊緣計算的 5G 網絡來進一步增加機器人專網,這將是智能服務機器人産業化的必由之路。
5. 邊緣智能支持多機器人協作的實踐與思考
5.1. 工業機器人發展趨勢
近年來,隨著物聯網、雲計算、大數據和人工智能爲代表的新一代信息技術與傳統工業技術的加速融合,全球新一輪科技革命和工業革命正蓬勃興起。在這種世界科技和工業發展背景下,德國、美國、日本、英國和中國等世界主要國家分別推出了工業 4.0、工業互聯網、工業智能化、工業 2050 和中國制造 2025 等一系列振興工業的國家戰略。習總書記曾經在兩院院士大會上指出:機器人是“制造業皇冠頂端的明珠”。作爲智能制造的核心裝備,工業機器人在智能制造的發展過程中起到了不可替代的作用。
工業 3.0 通過廣泛應用信息技術,已經使得工廠生産線的自動化程度和生産效率大幅度提高。但隨著時間的推移,業界逐漸意識到了一些問題:如今消費者的個性化需求繁多,生産線無法按照消費者需求生産出相應的産品,導致産品不暢銷或者産能過剩造成資源浪費。另一個重要的問題是,並沒有很好的利用整個産品生命周期産生和累積的數據。近年來隨著互聯網的蓬勃發展與人工智能算法的不斷改善,使得業界可以在一定程度上解決上述問題,工業 4.0 即智能制造應運而生。通過賦予生産線智能屬性,可以增加生産線的柔性,滿足消費者個性化需求,利用數據倉庫和數據挖掘做出生産決策,平衡多生産線負荷,提高有效産能避免資源浪費。同時又不得不面臨新的問題:原始設備的運算和存儲能力不足以滿足智能制造的要求,而隨著産品生命周期中産生的數據量的不斷累計勢必會增加雲端成本,並且數據安全如何保障也是一個問題。基于以上問題,新松構建了以雲-邊-端爲框架的平台。邊緣計算設備可以滿足數據的實時傳送與運算,並且在數據上傳到公有雲之前對數據進行分析與壓縮,私有雲則保證了數據的安全性,將控制力留在企業邊界。
當前,工業機器人呈現出以下三個方面的發展趨勢:
1)泛在互聯。由于以 AGV 爲代表的移動工業機器人將在未來廣泛使用,高可靠、高並發和低延遲的無線接入方式將成爲工業機器人雲平台的重要接入方式(包括環境的參數,多種設備接入的需求);
2)雲端融合。一方面,工業機器人的功能越來越強大,智能化程度越來越高,同時隨著大數據、雲計算和人工智能技術的快速發展,把基于大數據的智能化計算移到雲端實現是工業機器人的重要發展趨勢(工業機器人現場的數量的劇增,對分布式存儲和處理的需求);
3)智能服務。工業機器人發展至今,在工藝過程優化、遠程監控、狀態分析和預測性維護等生産使用環節積累了大量的數據和規則,如何利用機器學習和雲計算技術將這些海量數據、規則和知識形成機器人的智能服務,成爲工業機器人雲平台發展的必然要求(全生命周期的管理)。
機器人是靠近産線和數據源頭的網絡邊緣側的重要制造設備,也是融合網絡、計算、存儲、應用等核心能力的重要載體和平台。在網絡的邊緣智能側,機器人面向産線,就近提供邊緣智能服務,滿足行業數字化敏捷連接、實時業務、數據優化、應用智能、安全與隱私保護等方面的關鍵需求。
5.2. 多機協作應用
隨著小批量、多品種、個性定制等生産需求的不斷改變,對生産模式的柔性化要求越來越迫切,整個制造系統的數字化、網絡化和智能化是發展的必然趨勢。智能制造的“執行層”主要包括智能作業和智能物流,而工業機器人和移動機器人是其核心裝備:工業機器人完成在固定工位的精密、快速、高強度作業,移動機器人在生産車間、倉庫完成物料的搬運。
未來多機器人協作的邊緣智能將實體空間中的人員、設備、資源、環境、活動等要素,以數據驅動的方式在賽博空間中建立從個體到集群的狀態模型、關系模型、決策模型,通過狀態感知-實時分析-優化決策-精確執行的閉環過程實現對實體空間要素的精確管理和協同優化。
5.3. 多機器人邊緣智能系統架構
未來的多機器人邊緣智能系統架構圖如下,主要分爲幾個主要部分。
數據采集
針對不同類機器人或智能設備的數據,搭建統一的數據信息集成平台,形成設備“縱向”(設備端——管理層)與“橫向”(設備産業鏈各環節之間)的二維信息聯通平台,篩選出真正有用的數據,重點是將“原始數據”變爲“有用數據”。下表是一個産線作業過程中産生出的實時數據的例子。
邊緣計算
利用網絡計算資源,將知識鏡像建模和知識挖掘,在網絡層中形成實體的鏡像對稱模型和大數據環境,通過對實體運行曆史數據中的關聯性和邏輯性進行挖掘,産生能夠支持決策的制造知識,重點是將對數據的洞察變爲支持決策的知識,形成知識庫。邊緣計算設備作爲邊緣設備的輸出端,需要較高的實時性與擴展性。面對複雜的 IT 與 OT 設備混連的環境,我們需要有按照優先級處理事件的方案或者協議,比如TSN。而作爲雲端的輸入端則需要較高的穩定性。我們需要對邊緣計算設備做冗余以避免整個生産線失控的場景,比如分布式架構。而其自身的邊緣智能則需要較強的浮點運算能力以進行智能分析與決策,比如使用專用的加速芯片。
邊緣智能
如上圖所示,邊緣智能部署在邊緣計算設備上。與端設備,采用的 TSN 硬件協議與 OPC應用協議,最大限度保證了 IT 與 OT 的通信實時性與效率。與雲設備,則是采用了 TCP 傳輸數據與 RPC 進行遠程調用,保證了數據傳輸的安全穩定性,降低雲端與邊端之間的通信開發難度,提高系統穩定性與擴展性。
(1) 智能分析。將隱性問題顯性化,通過設備端的智能分析,准確評估設備真實的健康狀態(安全性,可靠性,實時性和經濟性等多個維度)和未來趨勢,並能夠對潛在的故障和隱性問題進行預診和定位,爲設備使用、維護和管理的智能決策提供重要決策支持依據,重點是將“有用數據”變爲“有用信息”。
(2) 智能決策。對狀態的識別和決策,以優化、協同爲核心手段,基于裝備真實健康狀態和衰退趨勢,結合用戶決策的定制化需求,提供設備使用、維護和管理的最優決策支持,並達成任務活動與設備狀態的最佳匹配,以保障生産系統的持續穩定運行(近零故障運行),將有用的信息變爲最優決策。
邊緣應用
形成工業的典型應用場景,不斷對于智能系統的動態優化和重構,將智能優化後的決策同步到設備的運行和企業資源運營的執行系統中,實現決策與價值的閉環。
(1) 優化生産線工藝流程。針對生産線中多機器人協同作業存在的作業時間不一致、路徑沖突等問題,基于多機器人協同工藝優化方法,挖掘多維工藝參數與作業效率、節拍之間的隱含關系,以生産作業效率、路徑最優爲目標,實現基于群體智能的多機器人協同作業工藝參數與運動軌迹優化。
(2) 完善生産的運營管理數據,爲更好的決策提供數據基礎。依據機器人的設計工藝、應用工藝,在三維環境下對機器人進行軌迹規劃、可達性分析以及幹涉檢驗等仿真;通過機器人作業效率分析實現對工藝方案的評價及優化。根據機器人生産線工藝規劃、多機協同作業規劃、排産及物流控制方案,驅動三維模型進行生産過程模擬,依據仿真結果進行機器人及其所在單元的應用工藝設計或優化過程的校驗與評估,實現機器人生産線運行效率、節拍平衡等目標優化。將仿真分析結果反饋至設計和應用環節進行驗證;更新機器人工藝設計知識庫,實現工藝操作透明化及工藝過程自主優化。
綜上,邊緣計算是擴展機器人個體智能的途徑。在未來的多機器人協作過程中,對于機器人的預測性維護,生産線的智能排産等方面也都是機器人在邊緣智能的重要應用方向。邊緣智能技術通過協同機器人設備與邊緣服務器,利用深度學習模型優化,深度學習計算遷移等方法,使機器人在未來的使用中,能更好的自主決策,同時也讓産線變得更智能,能夠支撐生産計劃靈活適應産線資源的變化,最終使産線變得柔性化、個性化、智能化,實現智能制造的升級。
6. 服務機器人的場景認知、進化和業務賦能的思考
6.1. 服務機器人多源異構數據協同認知
環境認知對于機器人而言是一個重要的研究環節。機器人對環境認知的目的是爲複雜未知環境下的機器人提供足夠的決策信息。這就需要將機器人通過圖像識別、導航定位、語音交互、觸覺感知等技術獲取的異構數據進行融合,實現優勢互補,從而提升機器人對周圍環境的感知能力。進一步,通過網絡與其它智能體協同,並結合知識,可以顯著提高認知的置信度。未來將有多個服務機器人在智能環境中共同工作。多機器人之間、機器人與環境之間都可以通過網絡和邊緣計算共享它們的感知信息和場景狀態信息。從認知數據融合的方法出發,將對自然環境的感知與理解從片面的、離散的、被動的感知層次提高到全局的、關聯的、主動性的認知層次上,全面深入分析機器人系統與環境之間的交互關系,以實現靈活、穩定、可靠的機器人環境認知系統。
6.2. 雲端一體架構支撐下的服務機器人認知進化
2010 年雲計算技術將從概念層面逐漸走向應用層面,許多研發公司已經將雲計算作爲新的戰略核心,並探索其企業級、社會級的應用。構建雲端一體架構,實現從樣本數據采集、標注、模型訓練到端側部署的整個過程。商用服務機器人領域,由于 B端客戶的需求多樣,場景複雜,更需要機器人具備較高的場景自適應能力。機器人作爲端側智能設備,可以通過雲端訓練支持,端側推理引擎部署,在雲端一體架構支撐下獲得認知能力的持續進化。
雲平台從終端機器學習、深度學習需求出發,把內存、I/O、存儲和計算容量通過網絡集成爲一個虛擬的資源池來使用。在雲端搭建訓練平台,集成分布式計算、並行處理等核心技術,構建虛擬化、高效、低成本、開放共享的系統架構,從終端機器學習需求出發,建立私有雲業務樣本數據庫,通過增量式學習和訓練,不斷優化前端模型准確度,構建差異化、個性化核心技術能力,爲前端業務持續賦能,爲業務決策提供更“精准”、更“智能”、更“廣泛”的技術支撐。
雲平台提供多元化的數據采集工具、智能爬蟲工具和數據標注工具,提供從數據采集獲取、數據清洗和後續的數據標注等一整套服務。依托機器人實際應用場景中的數據采集和大量已經收錄的公開數據集數據,包含文本、圖片、音頻、視頻等類型數據,覆蓋包括人臉檢測、人臉識別、人體檢測、物體識別、語音識別、智能安防等領域,提供更全面、更精准的原始數據和定制數據的采集、管理服務。
通過相機等圖像設備采集實際應用場景中的視頻數據,通過麥克風陣列等音頻采集設備采集音頻數據,雲平台進行數據管理、分類、存儲。分類的標准依據實際應用場景進行,可以根據數據類別,如人體樣本、桌子、椅子、顯示器、鍵盤樣本等分類,也可以根據垂直領域分類,如倉庫數據、銀行大廳數據、商超數據等。存儲的數據可以通過標注訓練、更新模型,更好地在垂直領域部署圖像智能和對話智能任務,實現機器人的能力面向垂直領域的逐步進化。
對于智能對話任務,在産品化項目測試完成後,整個系統將進行上線。接下來,伴隨著客戶對産品的使用,將産生大量的對話數據和協作數據,這些數據都將導入到雲平台的數據庫中。隨後,數據平台將提供接下來的技術和流程界面支撐,包括數據自動標簽,數據人工標簽,數據人工分析,數據擴容,框架/模型訓練,框架/模型測試相關模塊,從而達到整個系統知識庫的完善,模型場景精確度提高,框架合理性技術提升,系統的智能進化,最終客戶滿意度的持續提升。傳統的標注方式爲模型給出候選結果,人工進行判別、修改和再標注。雲平台可以結合用戶反饋,如在 VIP 打招呼時用戶是否答應,在回答問題後觀察用戶表情等方式,自動對回答進行判別標注,更新模型。此外,還可以通過“衆包模式”,通過用戶測試反饋點擊機器人回答是“好”是“壞”,作爲標注方式。通過增量式的學習和訓練,形成圖像智能和對話智能的自我進化能力。
6.3. AIOT 技術浪潮背景下服務機器人如何賦能業務
6.3.1. 服務機器人與業務場景的深度連接
AIOT 被視作一種將影響人類社會形態的技術浪潮,其實現路徑也值得服務機器人産業關注。換言之,AIOT 技術浪潮下服務機器人如何賦能業務?
如前文所述,服務機器人對場景的綜合認知能力和業務處理能力涉及對話智能、圖像智能、運動智能等技術環節。這其中,雲端機器學習訓練平台和雲端業務管理平台的開發維護至關重要,其意義不僅在于服務機器人本身的學習進化、日常運行、業務處理,也在于有機會與業務場景雲端實現某種意義上的對接,實現“雲端一體化”。
而除了雲端的對接,服務機器人的 AIOT 之路還需實現智慧場景下的多設備協同。機器人廠商可通過爲 B端客戶深度定制可信網絡傳輸協議,實現服務機器人與傳統設備間的數據傳輸鏈路,讓服務機器人與場景中的各類設備互聯互通。舉例而言,在第三方設備接入方面,機器人廠商需爲機器人預留豐富的可擴展軟硬件接口;在通信方面,需支持 WiFi、4G、藍牙、NB-IoT 等多種通信方式;在軟件方面,需預留可與客戶業務系統對接的接口,且機器人需具備集成能力;在架構設計方面,需在底層實現模塊和模塊之間的解耦,在應用層實現決策級或特征級的數據融合。
如此一來,服務機器人將成爲諸多行業業務場景 AIOT 網絡的重要實體終端;而通過提高網絡接入能力和計算能力,機器人又成爲邊緣結點之一,最終實現幫助客戶提升業務效率、服務水平的目的。
6.3.2. 案例簡析:服務機器人 AIOT 賦能智慧銀行、智慧檢務
下面,以科沃斯商用機器人有限公司打造的銀行服務機器人、案管機器人爲例,分析AIOT 技術浪潮下服務機器人賦能行業的具體路徑,以及不同垂直領域的共性與差異。
(1) 銀行服務機器人
行業需求分析
如今,傳統銀行網點存在運營成本高、使用價值低等問題,正逐步向智慧銀行方向轉型升級。智慧銀行以提升用戶服務體驗爲中心,利用人工智能、大數據等新興技術實現銀行服務方式與業務模式的再造和升級。其中,智能設備間的互聯互通尤爲關鍵,它使得信息傳遞的效率加快、准確性提高,讓衆多設備實現 N+N>2N 的聯動效果。
産品價值分析
科沃斯銀行服務機器人通過迎賓接待、業務咨詢、二次營銷等功能,爲顧客提供智能化、人性化的服務體驗,以服務爲切口、以 AIOT 爲路徑,賦能銀行智慧化轉型。下面結合科沃斯銀行服務機器人落地應用情況,簡析銀行服務機器人價值要素。
降低網點運營成本,優化網點營銷收益,提升銀行社會形象是銀行服務機器人的三大核心價值.目前,科沃斯銀行服務機器人已覆蓋中國建設銀行、中國農業銀行、中國銀行、平安銀行、興業銀行等 20 余家知名銀行。在位于新加坡的中國銀行全球首家創新研發基地,爲國際嘉賓承擔引導服務工作。截至目前,其爲銀行網點顧客提供的服務總量已超 800 萬人次,引導分流客戶成功總量約 30 萬人次,金融商品營銷成功總量超過 30 萬人次。通過提升銀行服務水准升級零售業務,旺寶深入銀行科技化進程。科沃斯智慧銀行應用案例已入選工信部《人工智能實踐錄》。
(2) 案管機器人
行業需求分析
根據《最高人民檢察院關于深化智慧檢務建設的意見》,到 2020 年底,充分運用新一代信息技術,推進檢察工作由信息化向智能化躍升,研發智慧檢務的重點應用;到 2025 年底,全面實現智慧檢務的發展目標,以機器換人力,以智能增效能,打造新型檢察工作方式和管理方式。目前,檢務工作中的一些難點需要以開創性的方式解決。如來訪人員在辦事過程中不熟悉流程,檢察機關人員需要花費大量的時間去回答辦事流程類的問題;辯護人和訴訟代理人缺少案件查詢與追蹤的平台;辦事人員對案件信息和法律文書有快速查詢需求等等。
産品價值分析
科沃斯商用機器人有限公司推出的案管機器人基于良好的人機交互能力和定位導航自主運動能力,能夠爲客戶提供主動迎賓、身份審核、業務咨詢與案件信息查詢、電子卷宗刻錄、本異地事項辦理等五大功能。案管機器人在檢察院業務場景中,類似于銀行服務機器人之于銀行場景,承擔了業務入口的重任,通過與現場機具的互聯互通,深度嵌入現有業務流程,優化業務邏輯,提高辦事效率,爲客戶創造實實在在的價值。
6.3.3. 展望:AIOT 領域服務機器人的市場機遇
綜上可見,服務機器人融入業務場景的重要抓手是人機交互能力。而在基于 IoT 技術的市場中,與人發生聯系的場景(無論是智慧政務還是智慧醫療、智慧辦公等)逐漸豐富,人機交互的需求愈發強烈。隨著近些年智能終端設備的發展,用戶對于人與機器間的交互方式也提出了全新要求,從被動交互到主動交互,從限定場景交互到多場景自適應交互,尤其在 AIOT 技術浪潮下,雲、邊、端能力的發展和一體化,服務機器人的人機交互能力將取得長足進展。
以科沃斯銀行服務機器人、案管機器人爲代表的 to B 服務機器人産品,在對話智能、圖像智能、運動智能融合的基礎上,通過與場景中其他設備之間的互聯互通以及雲端的服務能力,形成從端智能到雲平台的一攬子 AIOT 智慧化解決方案,與業務場景深度耦合,爲客戶提供從共性到個性的定制化服務。未來隨著服務場景的快速拓展和持續進化,服務機器人解決方案提供商需要抽象不同行業場景的共性需求,形成共性平台+應用子集的整體解決方案架構,通過共性部分的規模化降低行業服務成本,應用子集部分則需要通過服務中台的抽象和建立,構建針對 B端客戶個性化定制需求的快速響應能力,最終實現服務機器人産品的實質性落地和可持續發展。
7. 協同創新與合作共贏
爲了加速下一代服務機器人的規模化和商用化,亟需多方參與共同推進技術、産品、服務的嘗試、叠代和更新。在優勢互補的開放創新框架下,探討長期願景、研發前沿技術、推廣商業合作、搭建創新生態,吸引商業實體、科研院所、開源社區的廣泛參與和貢獻。
在機器人 4.0 演進過程中,要擺脫線性思維,建立跳躍式發展框架。具體來說,人工智能和人工增強要按需融合,在核心技術逐步演進過程中,從優化垂直應用場景入手,率先在關鍵場景爲用戶提供穩定可靠的服務。在 5G 通信技術的支撐下,本地數據采集和雲端知識共享應高效連接,通過不斷延伸服務場景,逐步減少人工增強的比例。在共享計算、存儲、通信資源基礎上,智能算法持續從(雲端)大數據和(本地端)個性化數據中抽取知識,逐步從特定場景適應到通用場景,最終實現機器人即服務(Robot As A Service)的長期願景。下圖描述了面向“機器人即服務”的協同創新框架,包含四個跳躍式發展的階段,以及每個階段的主要任務和目標。
7.1. 機器人 4.0 的基礎通用參考平台
針對這些需求,英特爾中國研究院提供了面向機器人 4.0 的基礎通用參考平台——HERO系統平台。底層是硬件計算平台,上面是軟件層。機器人 3.0 的部分,包括基本感知和交互、運動導航、規劃、操縱。機器人 4.0 部分更多支持自適應交互和持續學習,包括三維場景的語義理解和個性化的知識圖譜。
HERO 平台不僅可以提供基礎的軟硬件能力,並且可以基于該平台進一步擴展。例如,異構計算平台可以加入第三方硬件加速模塊,知識圖譜可以針對特定應用領域去擴展該領域的通用知識圖譜,可以利用其中提供的動態知識圖譜部分來獲取動態的人性化知識。自適應學習部分也可以加入更多的感知模塊來增強已有的感知功能或補充新的感知功能(這部分更詳細的信息可以參見自適應機器人交互 2.0 白皮書[11])。
7.2. 知識融合
越來越多的研究者認爲,人工智能技術將會從模仿人的行爲和決策過程過渡到了解人類的學習能力和運用知識的能力 [12]。在數字化時代,越來越多的信息被分析和存儲後,將被映射爲結構化的知識庫。知識工程和人工智能的結合,會大大提高模式識別和機器學習算法的精度。隨著認知科學、機器人學、自然語言理解等相關領域的發展,將催生出超越現有 Apple Siri、Google Now、IBM Watson 的推薦系統和問答系統,並且會跨越不同語言的邊界。通過建立知識庫和智能算法的良性循環,不斷完善對假設的驗證,實現預測和自我診斷。
7.3. 衆包與群體智慧
深度學習算法在語音識別和圖像分類中取得跳躍式發展的成績,很大程度上得益于規模足夠大的數據集、以及通過衆包技術給訓練數據打標簽的做法。在過去十幾年,衆包技術[13]從早期的創造內容 Wikipedia,到標注數據 Amazon Mechanical Turk,到投資創新項目 Kickstarter。在下一階段,群體智慧將會擴展到創造新産品、打造新服務。未來的衆包任務會更加細分、更加多樣化[14],和人工智能算法有關的包括標注數據、訓練模型,和人類增強有關的包括提出問題、做出決策,和雲端融合有關的包括可視化工具和人機交互接口。
7.4. 仿真訓練
在物理世界收集訓練數據,讓機器人從頭開始學習決策策略,會遇到很多挑戰。收集過程通常費時費事,有些任務會對人帶來危險,有些極端案例不容易收集到。計算機圖形學與仿真技術可以解決上述挑戰,通過在虛擬場景中配置不同的環境和任務參數,分解機器人的感知、決策、控制模塊,搭建模塊與模塊之間的狀態表征方法,實現從虛擬仿真到真實操作的跨越[15]。目前,基于增強學習框架,在獎勵函數和機器人操作之間形成映射和遷移關系,在模擬器中超實時地叠代訓練,可以大大縮短訓練時間和降低學習成本。
7.5. 機器人即服務
機器人即服務結合了雲計算、人工智能、機器人學、虛擬現實、自動化等,是數字經濟時代的全新業務模式[16],是“軟件即服務”、“平台即服務”、“基礎設施即服務”之後的新型服務模式。通過租借機器人服務,企業能夠以低成本、靈活、方便的形式完成不同的任務。機器人本體需要提供動態、可定制、可編程的接口和模塊,即可以在零售、農業、健康、物流、教育、制造等不同領域,填補日益擴大的勞動力短缺的缺口,提升運營效率,提高投入産出比。就像智能手機與手機應用市場的經濟模式類似,未來的機器人服務會激發硬件工程師、軟件工程師、交互設計師、産品經理、算法工程師、人工訓練師等參與,協同打造出機器人的應用市場、模型市場、技能市場、服務市場等。預計從 2016 年到 2026 年這十年間,機器人即服務的市場規模會增長到 340 億美元,複合年增長率達到 66%[17]。
8. 總結與展望
機器人技術是多學科交叉的科學工程, 涉及機械、電子、計算機、通信、人工智能和傳感器,甚至納米科技和材料技術等。毫不誇張地說,智能機器人是人工智能應用“皇冠上的明珠”。
近年來,人工智能和機器學習獲得快速發展,但機器人個體的自主智能距離人們的期待還有較大的差距,影響了機器人産業的規模化發展。如何利用跨領域的技術推動力,加速對機器人的賦能是機器人産業亟待解決的問題。本機器人 4.0 白皮書針對當前機器人産業現狀和瓶頸,提出構建雲邊端一體化的協同計算平台,並在此平台上支持機器人持續學習和協同學習的能力,實現基于個性化知識圖譜和場景自適應的融合,通過協同創新實現機器人産業規模化。
邊緣計算是最近幾年提出的新概念,其推廣和落地非常依賴于具體的應用,尤其適用于對實時性要求較高的場景。機器人應用正是非常合適的應用場景。邊緣實時計算加上雲計算的無限處理能力,可以大大提升機器人本體的人機交互和場景自適應能力,也會增強自主移動和感知能力。通過基于 5G 的雲邊端一體化,機器人本體的能力設計具有很大的彈性空間,從而解耦對機器人本體硬件能力的依賴,降低成本,推動大規模的部署就成爲可能。
由于篇幅所限,白皮書對有些相關的問題沒有深入探討,例如機器人的靈巧操控技術、多模態感知融合技術、多智能體學習等等。我們希望未來通過深化産業協同創新,對這些問題繼續探索。
雖然未來總是充滿不確定性,我們堅信 AI與 5G 的互相促進是機器人規模化發展的必經之路。希望機器人 4.0 白皮書中闡述的核心技術、雲邊端融合的系統框架和機器人跳躍式發展的思路,可以引領機器人技術和産業發展的方向。雲端大腦和安全專網的實踐和思考,以及智能制造和商業應用領域的經驗解析,能夠優化實施路徑,讓機器人盡快大規模地走進各行各業,走進千家萬戶!
以上內容選自《機器人4.0白皮書》