她叫王笑楠,17 歲讀清華,27 歲擔任博士生導師,輾轉海外留學和任教之後,又回到母校清華化工系擔任副教授。
圖 | 王笑楠(來源:王笑楠)
她的研究工作與近日發布的《麻省理工科技評論》2022 年“全球十大突破性技術”多項內容緊密相關,包括智能化碳捕集和利用、清潔能源、AI 數據生成、加密計算和各個前沿場景的應用等等。2021 年,她曾入選由 Elsevier 旗下 Mendeley Data 發布的“2020 年度科學影響力排行榜”,並受邀擔任多本國際期刊的副主編和編委,斬獲多項國際青年大獎。
2022 年伊始,她和團隊開年即迎“大豐收”,一口氣在頂刊連發多篇論文。他說這是組建“智慧系統工程”團隊五年來的積累,趕在虎年開局迎來了厚積薄發。其表示:“這些工作旨在面向實際應用,將人工智能技術和行業深度結合,提供了一種新材料研發的全新範式。我們將材料研發的全生命周期大大提速,實現了從‘鳥槍法’到‘地毯式搜索’的轉變,由‘釣魚’變爲‘打漁、網魚、養魚’,以科學的設計和預測指導實驗,而不是盲人摸象地試錯。”
針對器件尺度,開發三段式機器學習框架
以該團隊近期發表在 Nature Machine Intelligence 的論文爲例,他們針對器件尺度,開發出一個三段式機器學習框架[1]。
它能用于構建預測模型,可從初始納米材料設計入手,在 0.5% 到 350% 的應變範圍內自主設計傳感器的性能。借此解決了機器學習輔助的納米複合材料設計、以及軟體機器人應變傳感器領域存在的長期挑戰。另外,該工作通過混合制造方法,同時采用實驗室材料制造和虛擬數據增強計算,來解決新材料實驗數據不規範、數據量少等挑戰,在器件層面則構建出機器學習模型,以實現針對不同軟體機器應變傳感器的自動化設計。
對于上述三段式機器學習框架的能力,王笑楠表示即使在小樣本數據下,它也能在 0.5%-350% 的應變範圍內實現傳感器的自動化設計,最終可實現以下兩種自動化、智能化的交互設計:第一,可根據制造配方來預測傳感器的性能;第二,則可爲各種軟體機器人的不同需求,推薦適合的傳感器制造配方。
另外,他們利用統計分析工具,對收集到的傳感器特征數據進行分析,揭示了潛在的材料作用機制,挖掘到隱藏在數據背後的新型傳感器材料設計原則。比如,相比調整納米材料組分,調節傳感器形貌對最終傳感器的性能影響更大。另據悉,三段式機器學習框架可在數據采集率有限的器件水平上,進行雙向的自動化交互設計。
正如多篇文獻所提到的[2-3],目前機器學習面臨的一個關鍵挑戰,是開發新型機器學習工具來加速功能電子器件的開發。由于制造過程較爲耗時,難以獲得高質量的數據庫。而三段式機器學習框架,帶來的優勢有三:1、支持向量機分類器;2、主動學習;3、數據增強。這也讓該團隊得以快速收集具有代表性的數據點,並利用數據增強來訓練模型,並極大地加速了應變傳感器的預測模型的構建。
王笑楠表示:“該研究的第二個創新是實現了軟體機器人傳感器的自動化設計。它的成功意味著各類軟體機器人的傳感器制造配方,可直接由預測模型推薦,無需專家參與試錯實驗。而在此前,在如此寬的應變區間設計應變傳感器是難以完成的[4-5]。”
此外,通過對收集到的數據集進行統計分析和計算,王笑楠發現了制造配方和傳感器特性之間的複雜關系,這些數據驅動的關系和趨勢,被整理歸納爲新的材料設計原則,並通過原位電子顯微鏡研究得到進一步驗證。其表示:“這種用機器學習工具探索新的傳感器材料設計原則的設想,也被多篇領域內很重要的文獻提及[6-7],而我們的工作首次成功實現了這種方法。”
其中,第一作者楊海濤博士和李佳禮博士共同負責軟體機器人材料實驗框架的設計以及三段式機器學習框架的構建。
圖 | 結合主動學習、數據增強和優化模型的材料器件設計新範式(來源:Nature Machine Intelligence )
論文被選爲 2021 年 JACS 前 3 篇編輯和讀者精選論文,系唯一入選的華人團隊學術研究成果
針對微納尺度,王笑楠則聯合新加坡國立大學化工系賽義夫·汗(Saif Khan)教授、麻省理工學院(MIT)托尼奧·布奧納西(Tonio Buonassisi)團隊,合作開發了高通量微流控反應體系[8]。
“我們開創性地提供了貝葉斯優化和深度神經網絡結合的兩步算法,對于此類高通量平台不同階段的稀疏數據和海量數據實現了有效處理,加速了納米顆粒的合成研發。”
該工作發表後不久,王笑楠又在 JACS 發表了一篇論文,這次聚焦于分子尺度的研究[9]。期間,該團隊和新加坡國立大學化工系劉斌院士團隊開發出具備自我學習能力的分子、材料計算體系,加速了下一代材料開發過程。雙方結合材料第一性原理計算,基于貝葉斯優化的主動學習、以及深度學習預測模型,實現了高性能光敏劑的自我改進發現系統。
其中,來自王笑楠團隊的論文第一作者李佳禮博士提供了機器學習算法與框架的設計開發,並從超過 700 萬個分子的設計空間中,發現了 5357 個潛在的高性能光敏劑,進一步合成了其中四種分子,並顯示出與商業高性能光敏劑相當或更好的性能。
王笑楠表示:“該工作突破了主動學習在基于第一原理的材料設計中的潛力,所發現的材料結構將大大促進光敏化相關應用的發展,尤其是抗癌光動力療法等核心領域。”
圖 | 分子尺度的深度學習加速理論計算和設計(來源:JACS)
而她此前發表在 JACS 的另一論文,則針對儀器尺度做了相關研究。據悉,王笑楠和新加坡國立大學化學系呂炯教授團隊開發出一款基于先進機器視覺算法,可用于分析掃描探針顯微鏡的“一圖像一系統”深度學習框架[10]。爲證明其准確性和通用性,他們用該框架去確定由兩個具有兩種不同手性組織模式的超分子自組裝體組成的分子的手性。結果發現,該框架准確檢測了每個分子的位置,並標明了其手性,驗證了機器學習算法的巨大潛力,具備在廣泛的研究學科中自動識別複雜的掃描探針顯微鏡圖像模式的能力。
“論文還被選爲 2021 年 JACS 的 18 篇編輯特選之一,經過全球讀者的投票,被選作了 Top3 讀者精選文章。我們也感到很榮幸,希望在深度學習的前沿方法和應用上有更多突破。”王笑楠補充稱。
圖 | “看”得見會“思考”的智能儀器(來源:JACS)
用 AI 加速新型材料的研發
據悉,這一系列工作旨在用 AI 加速新型材料的研發,是 AI for Science 新興領域的一個重要分支。相較于制藥和結構生物學領域,深度學習與功能材料研發的結合起步更晚,但擁有極高的重要性。
而深度學習優異的高維複雜數據的處理能力、以及從數據中挖掘准確規律的能力,使其可以解決功能材料研究中遇到的問題。
王笑楠認爲:“用深度學習加速材料研發,已成爲新的範式。正因此,她和團隊展開一系列工作,並覆蓋不同尺度的新材料研發場景,比如分子尺度、微納尺度、器件尺度、平台尺度等。”
針對不同尺度的研發場景,王笑楠團隊分別與領域內的優秀課題組交流,詳細了解不同尺度下材料研發的特點,借此深化算法構架。
例如,針對分子尺度的材料,該團隊通過第一性原理計算得到大量的模擬數據,然後通過深度學習來加速第一性原理的計算,或通過主動學習來更高效地獲取數據,以便建立合適的數據庫。
而針對微納尺度,該團隊則主要考慮搭建高通量的微流控實驗平台,並結合高通量的表征工具來建立相關的數據庫。
針對器件尺度,由于尺度的增加會導致流程的複雜度增加,從而致使高通量數據采集過程更加困難。基于此,該團隊針對所要設計的器件材料,定制了專門的主動學習算法,並將器件性質的預測問題,拆解成多階段性的子問題來簡化預測難度,最後結合優化算法和數據增強算法,來進一步提升模型預測能力。
針對儀器和平台尺度,由于大量的儀器使用均會涉及到圖像分析,這時王笑楠等人使用機器學習算法,來加速自動化儀器和未來智能實驗室的實現過程。
圖 | 未來智慧碳中和實驗室(來源:王笑楠課題組)
助力清潔能源、碳捕集利用和“雙碳”目標
通過以上研究,該團隊已實現新材料研發效率的大幅提升,縮短了研發周期,亦降低了研發成本。
“通過將這類研發手段用于不同領域,我們有信心解決更多領域的痛點,比如設計開發先進的新能源和儲能材料、芯片材料以及碳捕集、利用與封存材料,助力國家實現清潔能源轉型,芯片自主化及碳達峰、碳中和等遠大目標。”王笑楠總結。
基于前期良好的基礎,該團隊會更加深化在各個材料尺度的機器學習框架,朝著構建未來智能實驗室這一方向而努力。目前,王笑楠正考慮將柔性機器人、自動化機器臂與高通量實驗平台、以及更智能的算法框架進行結合,以便在不同尺度不同種類的材料尤其是碳中和相關材料應用場景下,構建全自動智能化的實驗室。
-End-
參考:
1、Yang, H., Li, J. et al. Automatic strain sensor design via active learning and data augmentation for soft machines. Nat Mach Intell 4, 84–94 (2022).
2、Li, J. et al. AI applications through the whole life cycle of material discovery. Matter 3, 393-432, (2020).
3、Cao, B. et al. How to optimize materials and devices via design of experiments and machine learning: Demonstration using organic photovoltaics. ACS Nano 12, 7434-7444, (2018).
4、Araromi, O. A. et al. Ultra-sensitive and resilient compliant strain gauges for soft machines. Nature 587, 219-224, (2020).
5、Yang, H. et al. Wireless ti3c2tx mxene strain sensor with ultrahigh sensitivity and designated working windows for soft exoskeletons. ACS Nano 14, 11860-11875, (2020).
6、Shih, B. et al. Electronic skins and machine learning for intelligent soft robots. Sci. Robot. 5, eaaz9239, (2020).
7、Miriyev, A. & Kovač, M. Skills for physical artificial intelligence. Nat. Mach. Intell. 2, 658-660, (2020).
8、Mekki-Berrada, F., Ren, Z., Huang, T. et al. Two-step machine learning enables optimized nanoparticle synthesis. npj Comput Mater 7, 55 (2021).
9、Xu, S., Li, J. et al. Self-Improving Photosensitizer Discovery System via Bayesian Search with First-Principle Simulations. J. Am. Chem. Soc. 143, 47, 19769–19777, (2021).
10、Li, J. et al. Machine Vision Automated Chiral Molecule Detection and Classification in Molecular Imaging. J. Am. Chem. Soc. 143, 27, 10177–10188, (2021).