2019世界創新者年會(World Innovators Meet 2019, 簡稱WIM2019),于2019年12月6日在北京·國貿大酒店拉開帷幕。本屆大會由中國企業聯合會指導,億歐·EqualOcean、工業和信息化科技成果轉化聯盟聯合主辦,以“科創4.0:共建全球化新未來”爲主題,6000余名來自美國、英國、法國、澳大利亞、瑞士、以色列、俄羅斯、西班牙、葡萄牙、印度、新加坡等二十余個國家和地區的創新者齊聚一堂,共同總結2019年世界科技與産業創新的成果,預測2020年最新創新趨勢。
本次大會爲期三天(12月6日-8日),采用“9+1”的會議結構,即于8日舉辦的“1”場創新領袖峰會,于6日和7日舉辦的“9”場主題論壇。9場論壇分別圍繞當下最熱門的零售新消費、金融科技、投資新趨勢、智能硬科技、醫療大健康、産業互聯網等領域,以及青年、女性和科學企業家等群體展開。
在12月8日舉辦的創新領袖峰會上,眼神科技創始人兼CEO周軍發表了主題演講。他的主要觀點如下:
(1)多模態不是非此即彼的組合替代,而是基于數據融合的算法融合,並依托平台決策爲支撐。
(2)“多模態”是AI技術的下一步,更是AI落地的必經之路。
以下是周軍演講全文(部分有刪減)
感謝主辦方的邀請。今天又站在這裏,和去年不同,去年是講人工智能,今天講的是“十年一顧多模態”。這個單模態是什麽,兩模態是什麽,三模態又是什麽?多模態到底是什麽?
人工智能發展了這麽長時間,大家對他的預期越來越接近實際情況。剛剛一個朋友問我,人工智能到底發展到哪一步了?說實話,我不知道。我突然想講一個小故事。養寵物的人很多,當你回到家裏面,小狗會根據你的情緒做出反應:你開心的時候,它會陪你一起開心;當你累的夠嗆在沙發上時,它會乖乖的呆在你的身邊。我們家有一個小狗叫天球,如果昨晚它把你的拖鞋叼走了,當你早上醒來的時候,它會立刻叼回來;當你走向衣櫥的時候,它會立刻跑到門口等著給你開門。這麽簡單的一個小狗,它能根據你的表情、行爲時間,能判斷出你是否開心並做出一系列的反應。
我想給大家說一下,就這麽一個小狗的智商,人工智能需要花多長時間做到?按照現在的人工智能,或者弱人工智能時代,沒有20年很難做到這一步。這意味著,人工智能再過20年都很難達到小狗的水平,那麽達到小孩的水平需要多少年?
那麽人工智能接下來該怎麽做?什麽是多模態?
讓我講講多模態,眼神科技從事人工智能20多年,十多年前就在從事多模態的技術的落地,我有一些感想感悟、落地的案例和經驗想分享一下。
多模態在去年開始成爲焦點,很多知名企業比如說華爲、騰訊、百度,這樣的AI大廠,都開始逐漸的把目光瞄向多模態,很多創業公司也在思考這個方向性的問題。華爲投資多模態語義理解的公司,騰訊的AI Lab的俞棟博士有那麽一句話“多模態是邁向通用人工智能的重要方向”。通用人工智能是弱人工智能時代需要走向的一個方向,弱人工智能是 “見多識廣”,解決的是感知的問題,通用人工智能具有幾個屬性:自學習、增量學習、增強學習,這些內容結合在一塊,是強人工智能。從弱人工智能到強人工智能的奇點,截止目前還沒有突破。 “見少知多”、“不見而預知”的強人工智能時代,這是很多年國際前沿人工智能公司一直努力的事情,技術遇到了天花板。
多模態指的是多傳感器融合,不是非此即彼的組合替代。指紋識別、人臉識別、虹膜識別、指靜脈識別,每一個技術、每一個算法用一個傳感器解決一個問題叫單模態。隨著AI的發展、信息增加,AI被賦能被期待的模態越來越多,比如文本識別,圖片識別、文本和圖片組合識別、圖片和視頻組合識別等,各種信息從不同的方位,不同的傳感器到來,單一識別技術已經很難滿足這樣的發展。
如何解決識別誤導和傳感器感知局限問題,如何讓機器像人一樣感知和理解這個世界,我認爲是多模態才可以解決的問題。眼神科技致力于讓機器和人交流的時候,使機器具有像人一樣的眼睛,眼神科技因此而得名。
多模態市場需求旺盛,國外領軍企業堅持多模態。
國外知名的生物識別企業都在研究多模態,多模態已經成爲生物識別發展趨勢,EBA(歐洲生物識別行業協會)告訴我一個數據,到2023年歐洲生物識別的訴求達到115億美金。根據我們公司去年的情況,我們的人臉、虹膜、指紋三種技術在公司業務中已經形成了“三分天下“的收入角色。
眼神科技在多模態生物識別領域已經耕耘了20年時間。從1998年到2005年,公司一直在做指紋識別,在這期間也發現了指紋存在的問題,于是和人臉進行融合。這個階段是公司指紋技術發展、指紋和人臉融合的發展階段;2005年到2013年階段,這也是我來北京創業的階段。在這個時期,公司利用成熟的指紋識別技術,打開了全國50%的銀行市場。之後又開發人臉識別、虹膜識別技術,虹膜識別技術我們從2005年開始研發,到了2009年已經達到了全球頂級程度,這是整個基礎算法形成的過程。
在面向市場的推廣過程中,我們發現單一技術決策存在的一些問題,更需要打造分層決策,于是我們打造了ABIS多模態統一平台。整個公司技術研發過程中,我們獲得了400多項發明專利,獲得了國家技術發明二等獎。多模態決策體制是如何形成的?包含了融合算法,平台決策,ABIS平台三個方面,是基于數據融合的算法融合,並依托平台決策爲支撐打造。
從AI應用最前線——金融行業看多模態
眼神科技的研發一直是陪伴一個行業長大的,這個行業就是金融行業。公司在1998年就開始研究指紋,2002年,我們開始定位銀行並且做試驗。指紋的發展存在的最大問題,就是有很多人天生指紋淺、經常參加體育活動和體力勞動的人指紋也非常淺,舉例有一家公司有20萬人,其中1%的人指紋識別困難,用解決方案也無法解決。“科技不從善“讓指紋識別技術遇到了巨大挑戰,于是我不得不把指紋和人臉結合在一起解決問題。解決了銀行內部風控的問題後,如何降本增效,如何獲客成爲銀行發展的第二階段。用人臉識別可以解決獲客問題,可以做到人臉聯網核查和VIP的識別。運營過程中又發現,尤其手機遠端獲客,在幫著銀行降低成本和獲客的同時,會遇到防僞的問題,人臉識別不能作爲獲客的單一的識別手段,于是我們把人臉和虹膜識別組合起來識別。隨著銀行開放和生態的建設,”追客”和”幫客”成爲銀行重要的需求,這對生物識別和人工智能提出更大的挑戰。如何在場景中識別人、物、客,以及客戶需求的把握、精准營銷如何去做,讓銀行服務進入你的消費空間,進入你的生活,這個過程就需要生物識別技術的融合應用。今年,眼神科技中標了工商銀行人臉識別産品引入和虹膜、指靜脈算法提升服務項目,實現了指紋、人臉、虹膜、指靜脈四項核心生物識別技術與工商銀行全面合作。多模態是現在很多銀行都在努力探索的方式。
到目前爲止,眼神科技通過多模態生物識別技術,服務全球2000多家客戶,渠道客戶1000多家。經曆了二十年發展,在國內可以說是陪伴金融成長,也可以說是被金融驅使,一刻沒有停過,過去二十年一直在創新。總結一下,眼神多年的發展過程中,遇到問題、解決問題,用多種生物識別技術融合決策、多種技術解決一件事情。
我認爲多模態是長期發展的一個方向。希望更多的創新者,在各自領域的單模態上,好好的創新、耕耘,大家一起爲人工智能未來的發展創造一個良好的環境,謝謝大家!