采訪來源:硅谷高創會
引言:在2020年1月的硅谷高創會CES貴賓晚宴暨年度突破創新大獎頒獎典禮上,Dilili Labs憑借在過去一年裏在計算機視覺領域裏的技術研發進展,斬獲2020 SVIEF年度突破創新大獎。今天,硅谷高創會有幸邀請到Dilili Labs的CEO Stephen Li,來談談他對新一年技術開發的計劃,以及對計算機視覺技術未來發展和應用的理解與展望。
Stephen Li,畢業于美國西北大學和南京理工大學。曾在美國摩托羅拉(Motorola)、美國硅谷高通(Qualcomm)和MagicLeap擔任軟件技術高管。2016年在硅谷聯合成立了Dilili Labs,擔任CEO,組建了擁有硅谷頂尖的人工智能技術、管理和商務人才的團隊。
我們正一步步走向數字化的物理世界,機器將要理解世界。Dilili Labs專注于成爲人工智能視覺平台的領導者,幫助客戶快速部署功能強大,可擴展的視頻分析解決方案。在未來的幾年中,幫助全球客戶從數十億攝像頭中提取視覺數據,理解世界,讓世界變得更美好。
“談産品:現在BrainFrame已經是成熟的一款人工智能視覺平台,不僅服務于技術開發者,非技術的普通用戶也可以輕易使用BrainFrame提高業務和生産運營管理。它是業界第一個采用算法膠囊技術,在運營過程中,由用戶根據業務對視覺深度神經網絡進行實時配置和更新的人工智能系統。”
高創君:BrainFrame作爲Dilili Labs的主要産品之一,可以先談談設計的初衷是什麽嗎?想解決什麽樣的問題?
Stephen:BrainFrame可以說是在我們團隊工程師工作中應需而生的一個産品。我們在機器人視覺技術開發的過程中需要讓機器人能迅速處理在運動過程中看到的各種圖像和運動,需要開發這樣的技術幫助我們解決算法開發的各種挑戰。長期開發的過程中逐步演變成爲一項獨立的産品,面向廣大的計算機視覺和深度神經網絡應用開發者。作爲一款平台産品,讓神經網絡開發和集成,和部署標准化;讓效率和應用集成推廣成百上千倍的提升。讓傳統行業企業能更簡單、快速的看到投入産出效果,給傳統應用行業帶來價值飛躍。我們的工程師Bryce Beagle把這個産品命名爲BrainFrame。
現在BrainFrame已經是成熟的一款人工智能視覺平台,不僅服務于技術開發者,非技術的普通用戶也可以輕易使用BrainFrame提高業務和生産運營管理。它是業界第一個采用算法膠囊技術,在運營過程中,由用戶根據業務對視覺深度神經網絡進行實時配置和更新的人工智能系統。大家可以直接在Dilili Labs網站上下載BrainFrame免費版本,使用發布的算法膠囊或者進行二次開發。近期陸續會有更多視頻教程發布。
高創君:您說到非專業技術開發者也可以使用這款産品,可以詳細講講它可以被應用在哪些領域和場景嗎?
Stephen:BrainFrame目前已經在零售、餐廳、法院、工地、工廠産線等領域開始推廣和應用。BrainFrame會對視頻圖像內容進行實時分析和識別,並且根據預設的場景業務和管理流程,提供業務所需要的各種實時數據和統計信息。例如工作場所人員的位置,行爲規範,車輛和物品的管理,生産的動態管理和安全管理等。
我們很早以前就發現了餐廳行業對數據和監控的需求。餐廳行業從操作上來講,流程比較繁瑣,而繁忙的前廳和後廚讓生産流程的監控變得非常困難,同時隨著消費者對衛生和服務的要求不斷提高,連鎖餐廳在管理方面的需求是非常剛性的。我們經過了許多市場調研之後,認爲連鎖餐廳是一個非常大的潛在市場。
在餐廳場景中,BrainFrame可以直接部署,准確地把服務員和顧客區分開來,實現各種個性化數據的統計,比如平均每一桌客人用餐的時間,從客人就坐到端上第一杯水的時間,上菜的時間等等,同時,還可以監控服務員和後廚的行爲,是否有違反衛生安全的行爲,如果後廚人員沒有按要求洗手,BrainFrame可以根據攝像頭采集的數據識別出來並發出預警。這些功能可以幫助餐廳完善前廳和後廚人員的管理。
BrainFrame除了可以幫助餐廳優化監控和管理之外,還能統計大量市場方面的數據,幫助經營者作出正確決策。比如餐廳的排隊時間、客流量、翻台率、外賣占比等,這些數據對餐廳的市場營銷會有很大幫助。可以說,在一切都“用數據說話”的時代,BrainFrame在餐飲業有著很廣闊的需求。
BrainFrame可以被應用在餐廳、辦公室、生産線、社區等多種場合的管理,圖爲BrainFrame分別對打電話、喝水和吸煙行爲作出識別
高創君:那可以談談Dilili的另一款産品Synthall嗎?它的開發理念是什麽?針對的是哪個用戶群?
Stephen:Synthall針對的主要目標客戶是視覺深度神經網絡技術開發者。例如谷歌、英偉達自動駕駛技術的開發者,需要從幾百萬英裏的模擬駕駛中采集大量的數據來優化系統,所需的時間和金錢成本都非常高,因此他們采用3D建模來模擬汽車行駛的場景,並從中采集數據。
Synthall提供合成數據的解決方案,讓普通開發者也能迅速從構建出的3D環境中産生出深度學習所需要的圖片,這些圖片都是自動被Synthall標注好的,可動態編程調整,方便訓練神經網絡,大幅度降低了産生數據的成本。Synthall提供的方案是非常個性化的,使用者可以自定義3D場景模型,虛擬相機拍攝的位置和角度,光線和物體運動的方式等,適用于各種視頻和圖像領域的深度神經網絡技術開發者。此項技術在深度神經網絡圖像數據領域全球領先。
“談市場:克服做項目還是做産品難題的關鍵是找到大的核心用戶使用我們的産品,同時給廣大零散用戶留有個性化産品的空間。”
高創君:總體來說,今年Dilili Labs的市場計劃是什麽呢?
Stephen:BrainFrame是已經發展成熟的産品,今年處于一個市場推廣的關鍵期。我們的目標是把它大規模推廣到幾個重要的應用領域,完成在業務和應用領域的落地。如我剛才說的餐廳、零售、安全生産、油田、工廠生産線等等不同的場合,BrainFrame都可以發揮用途。
我們爲BrainFrame的一個關鍵定位是“Fast deployment”,用戶可以直接下載系統,根據應用需求現場配置系統,快速規模部署,立即對運營進行人工智能化管理。我們和主要的芯片供應商合作,提供端到端的解決方案。對系統集成商,我們提供完善的開發接口,和其他企業應用進行集成。我們今年會參加各種展會、講座活動,還會推出相關的視頻,通過這些方式把BrainFrame介紹給更多開發者。
高創君:在市場推廣方面,您可以預見到的最大挑戰是什麽?
Stephen:我相信我們的挑戰也是其他很多技術開發者面臨的挑戰,即是做産品,還是做項目。客戶的需求和銷售是最初推動技術開發的動力,但隨著各類客戶的需求差異,如果最後完全變成了應每個客戶需求定制的項目,就會不僅背離了産品的初衷,也增加了很多低效率的開發工作;最重要的是,爲了單個客戶定制的産品無法被直接應用在廣泛的領域,最終從産品型公司變成項目型公司。
Dilili的定位是一個産品型公司,但怎樣從這個過程中堅持下來,保持自己的産品特性,是對于我們這類公司的一個很大挑戰。我認爲克服這個難題的關鍵第一是聚焦核心應用。所以今年我們工作的重點是在針對幾個重點用戶的核心應用推廣我們的産品,在垂直領域發力;第二,把我們的産品從雲端做部署和授權管理,面向更廣大的開發者用戶。
我們通過OpenCV這個渠道,直接面對全球開發者,讓廣大開發者爲用戶進行個性化的開發。OpenCV是計算機視覺領域最大的開源軟件庫,每天有上萬個獨立訪問,幾乎每個做計算機視覺的開發者或多或少都會用到OpenCV。我去年加入了OpenCV硬件合作夥伴計劃,並在委員會擔任主席。我們在OpenCV發布了人工智能硬件兼容規範這個新概念,並通過OpenCV對算法膠囊技術進行了開源,作爲源代碼的maintainer,推動智能硬件做到應用端智能動態加載。通過與OpenCV的合作,迅速把算法膠囊在行業內推廣,樹立領先地位,實現人工智能硬件兼容的普及。感興趣的智能攝像頭制造商、芯片商、視頻監控系統集成商,可以直接下載算法膠囊開源代碼,並通過OpenCV網站硬件合作夥伴計劃了解算法膠囊。
“談願景:技術開發的根本是爲了造福人類,解決我們衣食住行、工作生産中遇到的困難,人工智能一定不能被用在錯誤的方向,這是最重要的。”
高創君:在人工智能飛速發展的今天,人工智能在很多領域的應用還處于探索階段,在計算機視覺領域也有很多有爭議的話題,例如個人隱私。作爲一個計算機視覺技術的開發者,您怎麽看待這個問題?您覺得Dilili Labs在未來發展中會遇到類似有爭議的問題嗎?
Stephen:隱私問題是人工智能,特別是計算機視覺技術發展的一個很重要的問題,尤其是在中國和美國文化差異的背景下,把人工智能技術應用在社會需要的領域是非常重要的。我個人是一個實用主義者,最初促使我創業的動力也是因爲看到了這個市場的巨大需求。我認爲,技術開發的根本是爲了解決我們衣食住行、工作生産中遇到的困難,怎樣讓工廠更高效運轉,怎樣讓遠程的交流變得更有效率,或者具體到提醒用戶外賣或者快遞送到、取走,訪客是客人還是陌生人等。
Dilili Labs擁有一個硅谷頂尖的團隊,在産品開發理念和技術上處于業界領先的地位。但我們的技術一定要用在正確的方向,這是最重要的。我們希望能通過和硬件設備生産方的合作來把我們的技術具體應用到諸多工作和生産場景裏,用數字化的方式運營物理世界,實現我們用技術造福人類、造福世界的樸素的願望。