大模型驅(qū)動(dòng)、人機(jī)協(xié)同的機(jī)器化學(xué)家云設(shè)施
中國(guó)網(wǎng)/中國(guó)發(fā)展門(mén)戶(hù)網(wǎng)訊 當(dāng)前,隨著大數(shù)據(jù)與人工智能(AI)技術(shù)的飛速發(fā)展,人類(lèi)正迎來(lái)新一輪科技與產(chǎn)業(yè)革命。一些代表性智能工具,如AlphaFold2和ChatGPT展現(xiàn)出了超越人類(lèi)解決復(fù)雜問(wèn)題的能力。人工智能技術(shù)的引入不僅極大地提升了科研過(guò)程中通用工具的效率和準(zhǔn)確性,更重要的是,它有助于構(gòu)建一個(gè)由產(chǎn)業(yè)需求驅(qū)動(dòng)科學(xué)研究的有效體系。本文旨在通過(guò)探討大模型驅(qū)動(dòng)、人機(jī)協(xié)同的機(jī)器化學(xué)家云設(shè)施建設(shè),進(jìn)一步探討“AI for Science”科研新范式的變革。
化學(xué)研究范式變革:挑戰(zhàn)、機(jī)遇與趨勢(shì)
化學(xué)作為一門(mén)基礎(chǔ)科學(xué),致力于研究物質(zhì)的組成、結(jié)構(gòu)、性質(zhì),及其在不同條件下的行為和與其他物質(zhì)之間的相互作用等。實(shí)驗(yàn)和理論兩種研究方法相互補(bǔ)充,共同推進(jìn)化學(xué)科學(xué)研究的進(jìn)步,在推動(dòng)新材料研發(fā)、探索新能源、改進(jìn)生物醫(yī)療技術(shù)等方面均有著重要意義和廣泛應(yīng)用。
化學(xué)研究領(lǐng)域面臨的挑戰(zhàn)
當(dāng)前,化學(xué)科學(xué)領(lǐng)域的研究對(duì)象日益復(fù)雜化和高維度化,這給科學(xué)研究帶來(lái)了巨大的挑戰(zhàn)。現(xiàn)行主流的研究方法依賴(lài)于窮舉試錯(cuò)和降低變量復(fù)雜度等傳統(tǒng)手段,其低效和局限性問(wèn)題日益凸顯。
從微觀的原子、分子尺度到宏觀的應(yīng)用材料尺度,物質(zhì)性質(zhì)受不同反應(yīng)條件及相互作用影響,難以進(jìn)行準(zhǔn)確預(yù)測(cè)和描述。人類(lèi)對(duì)于解析從微觀到宏觀尺度復(fù)雜系統(tǒng)底層規(guī)律的渴望日益增長(zhǎng),這種解析將對(duì)合成自動(dòng)優(yōu)化、按需逆向設(shè)計(jì)材料,以及精準(zhǔn)控制生物醫(yī)學(xué)過(guò)程具有重要指導(dǎo)意義。然而,從物理常數(shù)、薛定諤方程和元素周期表等基本規(guī)則到復(fù)雜應(yīng)用層面的自下而上演化,其中存在極大的復(fù)雜度和多樣性,這就導(dǎo)致現(xiàn)實(shí)世界問(wèn)題與結(jié)構(gòu)-效能關(guān)系之間的脫節(jié)。化學(xué)合成仍然依賴(lài)于專(zhuān)家經(jīng)驗(yàn),距離智能優(yōu)化目標(biāo)相去甚遠(yuǎn);數(shù)據(jù)的不完整和構(gòu)效關(guān)系的不明確,依舊是材料逆向定制設(shè)計(jì)的“攔路虎”;生物學(xué)領(lǐng)域中心法則過(guò)程的演變信息缺乏,限制了人類(lèi)對(duì)于疾病機(jī)理和生命本質(zhì)的認(rèn)知。
化學(xué)研究范式變革的機(jī)遇
為了積極應(yīng)對(duì)化學(xué)科學(xué)領(lǐng)域面臨的挑戰(zhàn),必須創(chuàng)新研究方法,革新研究范式。隨著大數(shù)據(jù)時(shí)代的來(lái)臨,數(shù)據(jù)驅(qū)動(dòng)的科研范式開(kāi)始嶄露頭角。人工智能擅長(zhǎng)從高維度、高復(fù)雜度的數(shù)據(jù)中探索變量之間的關(guān)聯(lián),這一趨勢(shì)為迎接挑戰(zhàn)提供了全新的機(jī)遇。
以深度學(xué)習(xí)和大模型為代表的人工智能技術(shù),具備學(xué)習(xí)能力、自適應(yīng)性、自主決策、模式識(shí)別與預(yù)測(cè)等特質(zhì),展現(xiàn)出超越人類(lèi)、智能決策的優(yōu)勢(shì)(圖1)。2016年,DeepMind公司開(kāi)發(fā)的人工智能程序AlphaGo采用深度強(qiáng)化學(xué)習(xí)技術(shù),結(jié)合深度神經(jīng)網(wǎng)絡(luò)和強(qiáng)化學(xué)習(xí)算法,對(duì)棋局策略進(jìn)行高效搜索并做出精準(zhǔn)判斷,超越了人類(lèi)傳統(tǒng)的啟發(fā)式圍棋搜索方法。這一圍棋界的人機(jī)較量成為人工智能發(fā)展史上的里程碑事件,首次展現(xiàn)出人工智能在復(fù)雜決策領(lǐng)域的應(yīng)用潛力;2021年,蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)程序AlphaFold2基于深度神經(jīng)網(wǎng)絡(luò)和自注意力機(jī)制,通過(guò)訓(xùn)練大規(guī)模序列數(shù)據(jù),實(shí)現(xiàn)對(duì)蛋白質(zhì)三維結(jié)構(gòu)的高精度預(yù)測(cè)。這一突破性成果,對(duì)藥物設(shè)計(jì)和疾病診斷具有潛在重要意義;2023年火爆全球的對(duì)話(huà)生成模型ChatGPT,運(yùn)用Transformer架構(gòu)中的自注意力機(jī)制和多層神經(jīng)網(wǎng)絡(luò)生成語(yǔ)言,并通過(guò)無(wú)監(jiān)督學(xué)習(xí)的方式不斷迭代語(yǔ)言生成能力,提升人機(jī)交互體驗(yàn)。其代表了人工智能在自然語(yǔ)言處理領(lǐng)域的突破式進(jìn)展,有望幫助人類(lèi)獲取信息及智能決策,實(shí)現(xiàn)通用認(rèn)知智能的涌現(xiàn)。
智能驅(qū)動(dòng)的機(jī)器人化學(xué)研究近年來(lái)取得了一系列突破。2022年,英國(guó)格拉斯哥大學(xué)的Cronin團(tuán)隊(duì)開(kāi)發(fā)了自動(dòng)化機(jī)器人系統(tǒng)Chemputer,其集成了文獻(xiàn)閱讀、實(shí)驗(yàn)方案定制、化合物合成和表征功能,能夠?qū)⑽墨I(xiàn)中的合成步驟轉(zhuǎn)換成機(jī)器可讀的化學(xué)描述語(yǔ)言,并儲(chǔ)存于內(nèi)部數(shù)據(jù)庫(kù)中,以便機(jī)器人自動(dòng)執(zhí)行。英國(guó)利物浦大學(xué)Cooper團(tuán)隊(duì)開(kāi)發(fā)了移動(dòng)機(jī)器人化學(xué)家,其可以高效執(zhí)行實(shí)驗(yàn),并使用貝葉斯算法優(yōu)化驅(qū)動(dòng),根據(jù)已有實(shí)驗(yàn)數(shù)據(jù)進(jìn)一步分析優(yōu)化實(shí)驗(yàn)計(jì)劃;不過(guò),Cooper認(rèn)為目前的機(jī)器人缺乏計(jì)算大腦,沒(méi)有利用已有的化學(xué)知識(shí),不能引入理論或物理模型,以致貝葉斯優(yōu)化是盲目的。2022年,中國(guó)科學(xué)技術(shù)大學(xué)江俊團(tuán)隊(duì)開(kāi)發(fā)出數(shù)據(jù)智能驅(qū)動(dòng)的全流程機(jī)器化學(xué)家,其由機(jī)器閱讀系統(tǒng)、機(jī)器計(jì)算系統(tǒng)和機(jī)器實(shí)驗(yàn)系統(tǒng)三大模塊組成,能學(xué)習(xí)前人知識(shí)與智慧,思考產(chǎn)生物理模型及提供智能預(yù)測(cè),并高效實(shí)驗(yàn)產(chǎn)生全生命周期數(shù)據(jù)。該平臺(tái)充分發(fā)揮機(jī)器數(shù)據(jù)可重復(fù)、可信任、可溯源、可對(duì)齊的優(yōu)點(diǎn),用精準(zhǔn)實(shí)驗(yàn)數(shù)據(jù)校準(zhǔn)理論的預(yù)訓(xùn)練模型,實(shí)現(xiàn)了理實(shí)交融的智能預(yù)測(cè)。
化學(xué)科學(xué)研究的發(fā)展趨勢(shì)
國(guó)際情況。自從ChatGPT在2023年初證明了通用認(rèn)知智能的可行性,不到半年時(shí)間,美國(guó)、英國(guó)、加拿大、荷蘭、瑞士等國(guó)紛紛加速投入發(fā)展裝備智能科學(xué)大模型的智慧大腦。2023年,美國(guó)更新發(fā)布《國(guó)家人工智能研發(fā)戰(zhàn)略計(jì)劃》,每年投入大量經(jīng)費(fèi)用于支持?jǐn)?shù)據(jù)科學(xué)、人工智能、量子信息等研究;2023年起,英國(guó)也投入經(jīng)費(fèi)開(kāi)始用于融合大模型、機(jī)器人和智能聯(lián)盟的智能創(chuàng)新工場(chǎng)建設(shè);2023年4月,加拿大向加速聯(lián)盟追加15億元人民幣投資用于建設(shè)大規(guī)模智能實(shí)驗(yàn)室基礎(chǔ)設(shè)施;2023年7月,荷蘭開(kāi)始打造機(jī)器人化學(xué)實(shí)驗(yàn)室;2022年12月,瑞士投入資金用于打造公共服務(wù)設(shè)施,借助大模型來(lái)驅(qū)動(dòng)機(jī)器人。具有化學(xué)智慧的機(jī)器科學(xué)家支撐產(chǎn)業(yè)數(shù)字化,也已經(jīng)成為現(xiàn)實(shí)。2022年,聯(lián)合利華60%的年度研發(fā)經(jīng)費(fèi)都用于購(gòu)買(mǎi)英國(guó)利物浦大學(xué)機(jī)器化學(xué)家材料創(chuàng)新工廠提供的智能合成與測(cè)試服務(wù)。
我國(guó)情況。目前,我國(guó)在覆蓋智能文獻(xiàn)調(diào)研與研究規(guī)劃、計(jì)算、實(shí)驗(yàn)、優(yōu)化全流程的機(jī)器化學(xué)家系統(tǒng)方面局部領(lǐng)先,但在大規(guī)模智能實(shí)驗(yàn)室與化學(xué)科學(xué)大模型方面亟須進(jìn)行建制化的項(xiàng)目部署,避免“起個(gè)大早,趕個(gè)晚集”。
機(jī)器化學(xué)家云設(shè)施:未來(lái)化學(xué)研究新工具
人工智能技術(shù)的飛速發(fā)展正在為化學(xué)科學(xué)研究帶來(lái)前所未有的機(jī)遇和挑戰(zhàn)。在當(dāng)前科技革命和產(chǎn)業(yè)變革的浪潮中,研發(fā)匯聚科學(xué)數(shù)據(jù)、人工智能算法、智能機(jī)器人和云平臺(tái)的化學(xué)研究新工具成為迫切而必要的任務(wù)。這一工具的研發(fā)有望解決長(zhǎng)期困擾化學(xué)科學(xué)革新的維度災(zāi)難和復(fù)雜巨系統(tǒng)黑盒問(wèn)題,從而推動(dòng)我國(guó)在高值化學(xué)品、功能材料、生物化學(xué)醫(yī)藥等領(lǐng)域取得顛覆性突破。
機(jī)器化學(xué)家云設(shè)施的內(nèi)涵
人類(lèi)化學(xué)家傳統(tǒng)的研究工作路線(xiàn)通常由提出需求、查閱文獻(xiàn)、設(shè)計(jì)方案、理論模擬和實(shí)驗(yàn)驗(yàn)證、提煉理論及解決實(shí)際問(wèn)題等流程組成。相較于人類(lèi)的研究方法論,涵蓋數(shù)據(jù)庫(kù)、人機(jī)交互、機(jī)器實(shí)驗(yàn)員、化學(xué)工作站和化學(xué)大腦的機(jī)器化學(xué)家云設(shè)施不僅能夠完全覆蓋以上流程,還可以通過(guò)人機(jī)交互系統(tǒng)進(jìn)行人機(jī)協(xié)同定制化解決特定難題(圖2)。
數(shù)據(jù)是現(xiàn)代科學(xué)研究的重要組成部分,對(duì)于機(jī)器化學(xué)家云設(shè)施而言更是至關(guān)重要。通過(guò)數(shù)據(jù)庫(kù)中海量化學(xué)數(shù)據(jù)驅(qū)動(dòng),機(jī)器化學(xué)家可以學(xué)習(xí)前人知識(shí)與智慧,人機(jī)交互提出科學(xué)問(wèn)題,再經(jīng)過(guò)融合科學(xué)大模型的化學(xué)大腦進(jìn)行思考,建立物理模型并提供智能預(yù)測(cè)。隨后給出研究方案,驅(qū)動(dòng)高效的機(jī)器實(shí)驗(yàn)員、化學(xué)工作站及智算服務(wù)器產(chǎn)生高質(zhì)量的實(shí)驗(yàn)數(shù)據(jù)和理論模擬數(shù)據(jù)。再通過(guò)數(shù)據(jù)反饋優(yōu)化科學(xué)大模型,形成垂直領(lǐng)域的應(yīng)用模型,從而解決具體科學(xué)難題。其獨(dú)特之處在于,能夠高效地整合數(shù)據(jù)知識(shí)、不斷調(diào)整理論和實(shí)驗(yàn)設(shè)計(jì),實(shí)現(xiàn)全流程的智能化推演。目前,中國(guó)科學(xué)技術(shù)大學(xué)研制成功了全球首個(gè)數(shù)據(jù)智能驅(qū)動(dòng)的全流程機(jī)器化學(xué)家,中國(guó)科學(xué)院自動(dòng)化研究所與武漢人工智能研究院推出了“紫東太初”全模態(tài)大模型,科大訊飛研制了“訊飛星火”認(rèn)知大模型,中國(guó)科學(xué)院在全國(guó)部署了20余個(gè)科學(xué)數(shù)據(jù)中心、智算中心,具備建設(shè)機(jī)器化學(xué)家云設(shè)施的良好基礎(chǔ)。
機(jī)器化學(xué)家云設(shè)施將帶來(lái)全新的科研組織形式,即機(jī)器實(shí)驗(yàn)員實(shí)現(xiàn)科研人員體力的解放,數(shù)據(jù)庫(kù)和化學(xué)大腦實(shí)現(xiàn)科研人員腦力的解放,云平臺(tái)智能管理決策系統(tǒng)實(shí)現(xiàn)個(gè)體間的鏈接,并通過(guò)新生成數(shù)據(jù)與科學(xué)大模型間的相互對(duì)抗校準(zhǔn),逐步進(jìn)行全局優(yōu)化,通力合作幫助科研用戶(hù)取得科學(xué)突破。整套設(shè)施將大力推動(dòng)我國(guó)科研組織形式的變革,實(shí)現(xiàn)大數(shù)據(jù)、認(rèn)知智能、機(jī)器學(xué)習(xí)、智能硬件等多領(lǐng)域的高度融合,推動(dòng)科學(xué)研究向更深、更廣領(lǐng)域拓展。
建設(shè)機(jī)器化學(xué)家云設(shè)施的意義
機(jī)器化學(xué)家云設(shè)施在實(shí)驗(yàn)機(jī)器人硬件中融合了深度學(xué)習(xí)和科學(xué)大模型等人工智能技術(shù),為聚合多學(xué)科方法論、融合多領(lǐng)域知識(shí)邏輯、耦合化學(xué)科學(xué)家群體智慧、減輕實(shí)驗(yàn)人員工作強(qiáng)度提供了技術(shù)底座,將加速實(shí)驗(yàn)設(shè)計(jì)和數(shù)據(jù)分析過(guò)程,提升化學(xué)科學(xué)研究的效率和準(zhǔn)確性。當(dāng)前,美英等多國(guó)紛紛加速投入發(fā)展裝備有科學(xué)大模型的機(jī)器科研工具。而智能領(lǐng)域是典型的“贏家通吃”,幾乎沒(méi)有后發(fā)優(yōu)勢(shì),只有搶占先機(jī),率先掌握先進(jìn)科研工具才能使我國(guó)在新一輪科技革命中不受制于人。因此,把握我國(guó)自主研發(fā)機(jī)器化學(xué)家的領(lǐng)先優(yōu)勢(shì),研制機(jī)器化學(xué)家云設(shè)施,能夠防范我國(guó)在智能化學(xué)研究新范式的基礎(chǔ)研究工具方面被“卡脖子”,爭(zhēng)搶智能化學(xué)領(lǐng)域優(yōu)勢(shì)地位。機(jī)器化學(xué)家云設(shè)施的建設(shè)也將對(duì)整個(gè)社會(huì)產(chǎn)生積極的溢出效應(yīng),推動(dòng)產(chǎn)業(yè)數(shù)字化,提升生產(chǎn)效率,還有望催生新一輪的產(chǎn)業(yè)革命。
總體而言,機(jī)器化學(xué)家云設(shè)施對(duì)增強(qiáng)我國(guó)在科技創(chuàng)新領(lǐng)域的競(jìng)爭(zhēng)力、確保在新興科技領(lǐng)域中的領(lǐng)先地位具有巨大而深遠(yuǎn)的意義,將助力我國(guó)在全球新一輪科技革命中取得更大的發(fā)展和突破。
機(jī)器化學(xué)家云設(shè)施:分層架構(gòu)
通過(guò)科學(xué)大模型預(yù)測(cè)和智能機(jī)器人實(shí)證相互對(duì)抗、協(xié)同進(jìn)化,打造具備化學(xué)科學(xué)智能的機(jī)器化學(xué)家云設(shè)施,將驅(qū)動(dòng)研究范式變革,產(chǎn)生重大科學(xué)突破。
化學(xué)科學(xué)數(shù)據(jù)庫(kù)
數(shù)據(jù)驅(qū)動(dòng)的研究范式中,科學(xué)數(shù)據(jù)的有效整合和利用是創(chuàng)新的核心驅(qū)動(dòng)力。然而,當(dāng)前科學(xué)數(shù)據(jù)普遍存在標(biāo)準(zhǔn)不統(tǒng)一、質(zhì)量良莠不齊、多來(lái)源數(shù)據(jù)相對(duì)獨(dú)立等問(wèn)題,限制了基于數(shù)據(jù)的化學(xué)科學(xué)研究。因此,迫切需要打破數(shù)據(jù)孤島現(xiàn)象,融合不同來(lái)源的理論和實(shí)驗(yàn)數(shù)據(jù)構(gòu)建多學(xué)科知識(shí)和多模態(tài)數(shù)據(jù)的人工智能化學(xué)科學(xué)數(shù)據(jù)庫(kù)。這將為化學(xué)科學(xué)領(lǐng)域的智能發(fā)展提供堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)。
化學(xué)科學(xué)數(shù)據(jù)庫(kù)將嵌入人工智能模型,并匯聚文獻(xiàn)數(shù)據(jù)、整合理論與實(shí)驗(yàn)數(shù)據(jù),包括以下4個(gè)方面。
化學(xué)科學(xué)領(lǐng)域數(shù)據(jù)匯聚。整合各單位數(shù)據(jù)資源,利用科學(xué)文獻(xiàn)中的文本、表格、圖像等多模態(tài)數(shù)據(jù),以及第一性原理模擬所產(chǎn)生的大量化學(xué)分子和材料的基礎(chǔ)物理化學(xué)數(shù)據(jù)。同時(shí),建立實(shí)驗(yàn)數(shù)據(jù)采集渠道和國(guó)家標(biāo)準(zhǔn),實(shí)現(xiàn)標(biāo)準(zhǔn)化數(shù)據(jù)的自動(dòng)采集和快速分析。
科技文獻(xiàn)機(jī)器閱讀工具建設(shè)。通過(guò)對(duì)來(lái)源于科技期刊、教科書(shū)、題庫(kù)等語(yǔ)料數(shù)據(jù)的清理、篩選和標(biāo)注,獲取高價(jià)值通用領(lǐng)域預(yù)訓(xùn)練語(yǔ)料和化學(xué)科學(xué)領(lǐng)域預(yù)訓(xùn)練語(yǔ)料。利用深度挖掘技術(shù)對(duì)科技文獻(xiàn)內(nèi)容進(jìn)行深入挖掘,從文本、圖像、表格中提取計(jì)算和實(shí)驗(yàn)數(shù)據(jù)。
數(shù)據(jù)精編與高質(zhì)量數(shù)據(jù)庫(kù)建設(shè)。標(biāo)注預(yù)訓(xùn)練語(yǔ)料,對(duì)文獻(xiàn)中的計(jì)算和實(shí)驗(yàn)數(shù)據(jù)進(jìn)行整編,并進(jìn)行數(shù)據(jù)分類(lèi)和質(zhì)量評(píng)估。開(kāi)發(fā)基于可解釋模型的數(shù)據(jù)鑒別和質(zhì)量評(píng)分技術(shù),以智能方式清洗數(shù)據(jù)。
知識(shí)嵌入與知識(shí)圖譜構(gòu)建。運(yùn)用映射關(guān)系分析構(gòu)建關(guān)聯(lián)模型,建立化學(xué)科學(xué)知識(shí)圖譜,包括結(jié)構(gòu)、性質(zhì)、演化關(guān)聯(lián)性。通過(guò)知識(shí)圖譜引導(dǎo)多模態(tài)數(shù)據(jù)融合,構(gòu)建統(tǒng)一、高效、可擴(kuò)展、結(jié)構(gòu)清晰的數(shù)據(jù)存儲(chǔ)格式。利用預(yù)訓(xùn)練模型等工具將知識(shí)圖譜嵌入到化學(xué)科學(xué)大模型中,提升知識(shí)的利用效率。
科學(xué)大模型
當(dāng)前,基于神經(jīng)網(wǎng)絡(luò)的大模型在預(yù)測(cè)方面存在可靠性不高、邏輯推理和語(yǔ)義理解深度不足、可解釋性和可調(diào)試性不強(qiáng)等核心問(wèn)題,因此在對(duì)準(zhǔn)確度要求較高的化學(xué)科學(xué)的應(yīng)用中表現(xiàn)不佳。針對(duì)這些問(wèn)題,需要發(fā)展基于數(shù)理邏輯的科學(xué)大模型,將數(shù)據(jù)驅(qū)動(dòng)的神經(jīng)網(wǎng)絡(luò)模型與知識(shí)驅(qū)動(dòng)的符號(hào)邏輯推理引擎深度融合,并應(yīng)用于數(shù)學(xué)、化學(xué)、物理等智能科學(xué)領(lǐng)域。
本研究提出的科學(xué)大模型框架在現(xiàn)有數(shù)據(jù)庫(kù)、潛在數(shù)據(jù)庫(kù)和終端應(yīng)用基礎(chǔ)上,專(zhuān)注于研究知識(shí)驅(qū)動(dòng)的推理引擎。該引擎構(gòu)建在領(lǐng)域本體和知識(shí)庫(kù)之上,并與數(shù)據(jù)庫(kù)和潛在數(shù)據(jù)庫(kù)連接,以模擬人類(lèi)思考的認(rèn)知推理和決策能力,從而彌補(bǔ)大型模型在可靠性、可解釋性和可調(diào)試性等方面的缺陷。
科學(xué)大模型通過(guò)綜合知識(shí)圖譜和基于化學(xué)認(rèn)知的知識(shí)增強(qiáng)算法,融入專(zhuān)家的化學(xué)知識(shí)和理解,利用特色化學(xué)描述符,創(chuàng)建基于化學(xué)原理的清晰人工智能算法,以解決大規(guī)模篩選和策略?xún)?yōu)化等復(fù)雜挑戰(zhàn),構(gòu)建出具備“化學(xué)智慧”的機(jī)器科學(xué)家大腦。根據(jù)用戶(hù)需求,設(shè)計(jì)實(shí)驗(yàn)方案和運(yùn)行流程,實(shí)時(shí)分析實(shí)驗(yàn)數(shù)據(jù),調(diào)整智能模型,并持續(xù)反饋優(yōu)化實(shí)驗(yàn)方案,實(shí)現(xiàn)實(shí)驗(yàn)方案和流程的自動(dòng)決策與優(yōu)化。
機(jī)器人平臺(tái)
機(jī)器人平臺(tái)將提供高效、精準(zhǔn)的實(shí)驗(yàn)和數(shù)據(jù)處理解決方案,具體包括以下4個(gè)方面。
基于微通道連續(xù)流的全自動(dòng)高通量研究系統(tǒng)。系統(tǒng)旨在精確、自動(dòng)、高通量地進(jìn)行重要有機(jī)化學(xué)反應(yīng)和關(guān)鍵功能材料合成,需要解決多領(lǐng)域技術(shù)問(wèn)題,并集成多個(gè)關(guān)鍵功能子系統(tǒng),包括多通道反應(yīng)物自動(dòng)切換、微通道連續(xù)流反應(yīng)、產(chǎn)物收集和后處理、在線(xiàn)檢測(cè)和自動(dòng)采樣、色譜接口、反應(yīng)溫度控制、總控和人機(jī)交互系統(tǒng)。
全自動(dòng)高通量研究系統(tǒng)的功能擴(kuò)展。為確保高通量實(shí)驗(yàn)結(jié)果可靠性,各子系統(tǒng)配備冗余傳感器,并結(jié)合視覺(jué)識(shí)別技術(shù)進(jìn)行實(shí)時(shí)反饋和異常數(shù)據(jù)自動(dòng)篩選。研究人員只需準(zhǔn)備反應(yīng)物庫(kù)和輸入反應(yīng)矩陣,系統(tǒng)即可完成實(shí)驗(yàn)、后處理和檢測(cè),并批量輸出數(shù)據(jù)。未來(lái)可通過(guò)增加子系統(tǒng)和功能模塊,拓展研究范圍,完成更復(fù)雜的后處理和檢測(cè)分析工作。
全自主實(shí)驗(yàn)的移動(dòng)操作機(jī)器人。設(shè)計(jì)六自由度機(jī)械臂與全向移動(dòng)底盤(pán)的軟硬件集成;設(shè)計(jì)實(shí)驗(yàn)室環(huán)境的視覺(jué)感知算法,以及高精度視覺(jué)引導(dǎo)、實(shí)時(shí)力反饋的靈巧控制方法;研究多模態(tài)數(shù)據(jù)的高精度定位和建圖方法,開(kāi)發(fā)動(dòng)態(tài)避障算法和任務(wù)管理系統(tǒng),實(shí)現(xiàn)移動(dòng)操作機(jī)器人的全自主實(shí)驗(yàn)。
全流程智能化學(xué)實(shí)驗(yàn)室。研制自主知識(shí)產(chǎn)權(quán)的自動(dòng)封裝機(jī)、液體自動(dòng)分配工作站和電化學(xué)自動(dòng)化測(cè)試工作站,同時(shí)設(shè)計(jì)全自主移動(dòng)操作機(jī)器人、高通量實(shí)驗(yàn)平臺(tái)、實(shí)驗(yàn)儀器設(shè)備的協(xié)同控制系統(tǒng)和全流程任務(wù)調(diào)度系統(tǒng),以搭建集成化學(xué)合成、譜學(xué)表征和性能測(cè)試等功能的全流程智能化學(xué)實(shí)驗(yàn)室(圖3),實(shí)現(xiàn)化學(xué)研究的全場(chǎng)景覆蓋。
智能管理決策系統(tǒng)
智能管理決策系統(tǒng)即智能化學(xué)云平臺(tái),包括機(jī)器化學(xué)家指令集、操作系統(tǒng)、聯(lián)邦學(xué)習(xí)算法系統(tǒng)等,促使機(jī)器化學(xué)家能夠在不同實(shí)驗(yàn)任務(wù)和實(shí)驗(yàn)室之間進(jìn)行遷移學(xué)習(xí),最終構(gòu)建標(biāo)準(zhǔn)化的云平臺(tái)層面智能化學(xué)實(shí)驗(yàn)室(圖4)。
指令集包括開(kāi)發(fā)接口函數(shù)、通信協(xié)議、設(shè)備規(guī)范和數(shù)據(jù)標(biāo)準(zhǔn)4個(gè)部分的標(biāo)準(zhǔn)化,以支持不同來(lái)源的數(shù)據(jù)對(duì)齊,實(shí)現(xiàn)數(shù)據(jù)互聯(lián)互通。具有友好人機(jī)交互界面、明確業(yè)務(wù)流、直觀數(shù)據(jù)可視功能的操作系統(tǒng)幫助科研人員擺脫物理空間限制,遠(yuǎn)程即可開(kāi)展實(shí)驗(yàn)、模擬和數(shù)據(jù)分析,同時(shí)也便于系統(tǒng)整體進(jìn)行實(shí)驗(yàn)任務(wù)調(diào)配、合理安排資源。聯(lián)邦學(xué)習(xí)算法系統(tǒng)的核心是數(shù)據(jù)不動(dòng)、模型動(dòng),即可以在保障數(shù)據(jù)隱私安全的前提下,支持不同用戶(hù)不同實(shí)驗(yàn)室之間的數(shù)據(jù)共享。
通過(guò)發(fā)布智能化學(xué)實(shí)驗(yàn)室的標(biāo)準(zhǔn)規(guī)范,實(shí)現(xiàn)在云端共享使用數(shù)據(jù)庫(kù)和人工智能模型。這一系統(tǒng)旨在實(shí)現(xiàn)智能管理決策,促進(jìn)不同實(shí)驗(yàn)室間操作的高效性和一致性。
結(jié)語(yǔ):依托機(jī)器化學(xué)家云設(shè)施變革化學(xué)研究范式
以蒸汽機(jī)和電機(jī)為代表的前兩次“碳基”工業(yè)革命幫助人類(lèi)突破了“體力”的限制,以計(jì)算機(jī)為代表的第三次“硅基”信息技術(shù)革命幫助人類(lèi)突破了“算力”的限制。智能時(shí)代已經(jīng)到來(lái),突破人類(lèi)“腦力”限制的第四次通用智能工業(yè)革命已呼之欲出。呼應(yīng)時(shí)代浪潮,機(jī)器化學(xué)家云設(shè)施的化學(xué)科學(xué)數(shù)據(jù)庫(kù)、科學(xué)大模型、機(jī)器人平臺(tái)、智能管理決策系統(tǒng),將集成解放人類(lèi)科研人員的“記憶力、體力、算力、腦力”限制,打破科研過(guò)程中的知識(shí)壁壘、空間限制、學(xué)科界限,智能連接科研個(gè)體并大幅度拔高其科研能力,全面變革我國(guó)化學(xué)科學(xué)乃至整個(gè)物質(zhì)科學(xué)研究范式。
(作者:崇媛媛、馮碩、王嵩、江俊,中國(guó)科學(xué)技術(shù)大學(xué)精準(zhǔn)智能化學(xué)重點(diǎn)實(shí)驗(yàn)室。《中國(guó)科學(xué)院院刊》供稿)