“冷板凳”式科研過時了嗎
“化學研究的初級階段好比交通方式中的‘步行’,隨著技術手段升級,研究程度加深、效率變高,等于用上了自行車、摩托車、汽車。當引入人工智能,好比坐上火箭。最終必然‘量變引起質(zhì)變’,帶我們?nèi)ヒ郧叭ゲ涣说牡胤?。”在中國科學技術大學,精準智能化學重點實驗室主任李震宇用這樣一個比喻形容化學研究的變革。
“去以前去不了的地方”是李震宇和所在實驗室團隊孜孜不倦的科研追求。今年1月,中國科學院精準智能化學重點實驗室正式獲批建設,由近100位年輕人組成,除化學與材料科學專業(yè)的師生外,還包括計算機、人工智能、大數(shù)據(jù)等方向的研究人員,聚焦如何改變化學研究范式這一關鍵科學問題,形成集群和協(xié)同攻關優(yōu)勢。
縱觀歷史,化學研究由煉丹、煉金演變而來,人類衣食住行離不開化學物質(zhì)。同時,作為基礎科學的化學,也是多學科交叉的聚集點和出發(fā)點,化學研究在能源、環(huán)境、材料、生物醫(yī)藥等應用領域扮演日益重要的角色。
歷經(jīng)數(shù)百年科研攀登,如今,精準智能化學成為化學家的夢想,更是實現(xiàn)化學學科跨越式發(fā)展的契機。而以人工智能為代表的新技術會不會重新定義化學的未來,改變化學研究的面貌?新興技術的雙刃劍會對研究范式帶來哪些沖擊和影響,師生們又有哪些對策和新招?這些問題一直縈繞在科研工作者心中。
化學版GPT來了,激起科研范式變革浪花
在精準智能化學重點實驗室中的機器化學家實驗室,青年科研人員只需在控制大屏輸入指令,兩個動作靈活的機器人“小來”和“小?!本涂梢栽趲讉€操作臺間穿梭,伸出機械手臂進行試劑配制。
中國科大化學與材料科學學院教授江俊團隊開發(fā)了全球首個集閱讀文獻、設計實驗、自主優(yōu)化于一體,覆蓋化學品開發(fā)全流程的機器化學家平臺,從數(shù)百萬的可能組合中找到全局最優(yōu)解加快材料研發(fā)。業(yè)內(nèi)專家認為,該成果引領化學研究朝著知識理解數(shù)字化、操作指令化、創(chuàng)制智能化的趨勢前進,將對化學科學產(chǎn)生巨大影響。
江俊團隊有近30位成員,大多是90后、95后,大家懷抱“做中國人自己的材料數(shù)據(jù)庫”的科研夢想。在關鍵節(jié)點——建立數(shù)據(jù)庫知識圖譜時,團隊曾吃了很多苦頭:數(shù)據(jù)質(zhì)量良莠不齊,無法進行高效檢索,不得不投入大量人力物力為數(shù)據(jù)打上識別標簽。
無奈和碰壁倒逼江俊提升研究效率,2014年,建立會思考的“化學大腦”的念頭在江俊心中萌發(fā)。他找來人工智能、電子科技、數(shù)學、化學等專業(yè)方向人才,組成交叉學科背景的團隊,將大數(shù)據(jù)和人工智能技術注入平臺的計算大腦,建立理實交融的智能模型。歷經(jīng)8年探索,打造初代機器化學家“小來”。
值得一提的是,在高熵催化劑等實驗中,“小來”可以從55萬種可能的金屬配比中找出全局最優(yōu)解,將傳統(tǒng)“試錯法”實驗所需的1400年科研周期縮短為5周。
論文閱讀、機器人做實驗、數(shù)據(jù)分析、優(yōu)化篩選……當前,江俊團隊科研全流程都有人工智能的貢獻印記,今年年初,在多任務處理性能上實現(xiàn)升級的第二代機器化學家小?!罢Q生”。
如今,團隊又自主研發(fā)了一款閱讀了50萬篇文獻的化學領域聊天機器人程序Chem-GPT,它能夠針對使用者提出的問題,給出從文獻中學習到的可靠答案,從而驅(qū)動機器化學家做實驗,助力化學品和新材料研發(fā)。
江俊分析,人工智能給化學研究帶來如下改變:基于大語言模型,從文獻、專利、教科書等數(shù)據(jù)源中挖掘化學數(shù)據(jù),建立化學知識圖譜,用于支持化學研究決策和創(chuàng)新;建立物質(zhì)的結構、組分、制備工藝等因素與性質(zhì)間的關系模型,用于指導新型的分子、材料、催化劑、藥物等的設計與優(yōu)化;結合人工智能技術幫助化學家自動設計實驗方案、優(yōu)化實驗過程,并進行自動測量表征。
他談道,對人工智能機器人平臺而言,首要挑戰(zhàn)是“如何賦予機器人物質(zhì)級別的感知能力和對化學過程的預判能力”。這兩個能力是讓人工智能能夠真正理解復雜物質(zhì)世界、捕捉化學系統(tǒng)的本質(zhì)特征規(guī)律的關鍵。在他的科研藍圖里,未來研發(fā)出模仿學習人類科學家創(chuàng)造力、具備“看”“聞”“聽”“觸”環(huán)境感知的“智慧科學家”,進而實現(xiàn)數(shù)據(jù)與智能驅(qū)動的化學研究新范式。
李震宇總結道,傳統(tǒng)的研究范式深度依賴于“試錯法”,效率低。公眾對化學的認識停留在不環(huán)保、不經(jīng)濟、不安全等刻板印象,迫切需要提升化學研究的精準程度與效率,讓公眾對化學面貌有新的認識。而人工智能等先進技術,無疑有助于探索建立化學研究的精準化、智能化雙驅(qū)動模式。
人工智能浪潮下,科研還需要坐“冷板凳”嗎
當先進技術不斷迭代應用,讓人不禁思考,我們是否還需要“冷板凳”式的科研,反復試錯的意義又在哪里?
近日,中國科學技術大學姚宏斌課題組、李震宇課題組與浙江工業(yè)大學陶新永課題組合作,基于雙碳背景下電化學儲能發(fā)展的新范式,設計開發(fā)出鑭系金屬鹵化物基固態(tài)電解質(zhì)新家族LixMyLnzCl3,在無任何電極修飾的情況下實現(xiàn)了室溫可運行的全固態(tài)鋰金屬電池,成果于今年4月5日發(fā)表在《自然》(Nature)雜志上。
這一被業(yè)內(nèi)專家稱贊為電化學儲能領域固態(tài)電解質(zhì)材料新突破的背后,一群年輕人就飽嘗“冷板凳”之苦。從湘潭大學材料科學與工程專業(yè)推免至中國科大讀研的羅錦達是其中之一,進組3年,他從零基礎“小白”成長為科研主力。
2021年2月,還在讀大四的羅錦達抱著學習的心態(tài)來到中國科大做畢業(yè)設計,剛好趕上上述課題的萌芽狀態(tài)。大四畢業(yè)后,沒有畢業(yè)旅行和假期,他幾乎每天都在實驗室中度過。每位前輩都耐心解答這位準研一新生提出的每個問題,正是在這種尊重科研的氛圍下,“跨界”應用化學方向的羅錦達,往研究中心地帶快速成長靠攏。
由于對計算機編程感興趣,羅錦達每天一有空就前往圖書館讀論文、書籍。研究中,他和小伙伴每天晚上在實驗室待到很晚,每人分別分析和復盤研究進展。此前,組內(nèi)一位學長嘗試用第一性原理計算來研究材料擴散性質(zhì),但由于沒有考慮到材料尺寸效應以及界面的應力作用,結果和預期相反。
“因為實驗原材料、環(huán)境天氣等客觀因素和操作不當、經(jīng)驗不足等主觀原因,研究過程中遇到挫折是家常便飯,尤其是理論計算,有時花費大量時間精力,最后發(fā)現(xiàn)結果不盡人意。但不能因為一條路走不通,就否定大的科研方向,要不斷總結原因?!绷_錦達說。
那位學長畢業(yè)離組后,羅錦達接過關鍵的理論計算模擬任務,并調(diào)整思路,從零開始學習分子動力學知識。他嘗試運用密度泛函理論、分子動力學模擬和鍵價位能等方法,來研究實驗對象獨特的結構和離子傳導機制,從原子尺度更好地理解鋰離子的擴散行為,對后續(xù)實驗合成有很大的指導作用。
處理計算模擬數(shù)據(jù)時,羅錦達又化身“程序員”,自學編程語言python,他覺得,每天都專注解決一個新問題,這種生活開心且充實。
最終,團隊根據(jù)計算機模擬結果,設計出常溫條件下可以穩(wěn)定存在的鑭系金屬氯化物,合成出相應的固態(tài)電解質(zhì)。他們把研究數(shù)據(jù)錄入合肥先進計算中心進行模擬分析,最終實現(xiàn)鋰離子在空間里的快速傳導。
“先進的技術可以幫助科研人員快速分析和處理知識、提取有用信息、找出規(guī)律和趨勢。”在姚宏斌看來,有了先進的計算方法,未來計劃引入人工智能機器學習,可以優(yōu)化出更好的電解質(zhì)體系,探索新的高性能固態(tài)電解質(zhì)材料,實現(xiàn)更穩(wěn)定的界面并適配到實際的電池中。
但他同時指出,科研的本質(zhì)創(chuàng)新和發(fā)現(xiàn),以及對問題深入思考和探索,這些過程往往需要反復試錯和不斷嘗試。即使在數(shù)據(jù)處理方面已經(jīng)有了成熟的技術工具,年輕人在做科研的數(shù)據(jù)積累階段仍然需要坐“冷板凳”,這是幫助年輕人更好理解問題的必經(jīng)之路。
李震宇持有相同看法。他觀察到,人工智能擅長高通量的精準實驗、大規(guī)模數(shù)據(jù)處理等能力,但并不具備人類的創(chuàng)造性和判斷力等思維能力,無法創(chuàng)造出超越現(xiàn)有新穎化學思想的方法。因此,“冷板凳”有助于培養(yǎng)對化學有深刻理解和洞察力的人才。
據(jù)江俊課題組核心成員肖恒宇博士分析,年輕人在科研數(shù)據(jù)積累時,可以利用人工智能技術來加速數(shù)據(jù)生成、收集、整理,但在研究尚未深入的領域,缺乏經(jīng)驗的學生需要反復試錯。
人和AI如何“打配合”,科研效果才能最優(yōu)
采訪過程中,很多師生提到了化學研究中“數(shù)據(jù)”的重要性——數(shù)據(jù)和技術相伴相生,人與技術的“合作關系”也離不開數(shù)據(jù)的支撐。
江俊團隊的機器化學家自誕生之初就與海量文獻數(shù)據(jù)打交道?!皵?shù)據(jù)時代給我們帶來新機遇,同時也帶來不少難題。本質(zhì)上說,智能來自對數(shù)據(jù)的學習,數(shù)據(jù)少,有用的知識就少,一些小數(shù)據(jù)對于化學研究來說珍貴稀疏,因此,做實驗‘很貴’?!苯≌f。
“現(xiàn)階段大部分數(shù)據(jù)都是從文獻中收集來的,而文獻中的數(shù)據(jù)經(jīng)常是被‘美化’過的理想數(shù)據(jù)。此外,標注數(shù)據(jù)需要大量人力物力,隨著數(shù)據(jù)需求上升,這部分成本會越來越高?!苯≌n題組博士生喬欽禹說。
還有部分師生談及,由于現(xiàn)存研究數(shù)據(jù)來源多且雜,當高質(zhì)量和低質(zhì)量數(shù)據(jù)混在一起,人工智能很容易學到“錯誤的數(shù)據(jù)”,開頭就錯了,后面自然會影響效率甚至準確性。
算力算法的缺失也是現(xiàn)階段痛點之一。
由于GPU算力不足,使得江俊團隊的ChemGPT“跑不快”,訓練迭代起來很慢?!叭斯ぶ悄艽笠?guī)模應用勢不可擋,現(xiàn)有人工智能算力不足是亟待解決的問題?!苯≌n題組的博士生馮毅也注意到類似問題。
“精準化學非常依賴實驗數(shù)據(jù)的準確性?!崩钫鹩罡嬖V記者,改變現(xiàn)有痛點的可行路徑是通過精準計算和精準制備,得到大量精準數(shù)據(jù),從數(shù)據(jù)出發(fā)來得到高的化學智能。有了智能技術以后,再回過頭來對化學反應、分子性質(zhì)、材料性質(zhì)進行做精準調(diào)控,形成完整的研究閉環(huán)。
喬欽禹也曾對二者的“分工”做過設想:低端、可重復的循環(huán)實驗操作,交給人工智能、自動化等技術來完成,以完成數(shù)據(jù)積累;而分析、創(chuàng)新、糾錯等操作交給人來做,例如總結規(guī)律,發(fā)明創(chuàng)造等。
李震宇提出,最佳合作模式應由人類提出科學問題和假設,人工智能設計實驗、采集數(shù)據(jù)、構建模型并驗證人的假說。同時,人類可以根據(jù)人工智能化學實驗機器人提供的數(shù)據(jù)和反饋,調(diào)整和改進自己的化學思路和方法,共同完成更高水平的化學研究。
姚宏斌也期待,“希望整個范式更加精準化、智能化,通過人工智能自主學習和優(yōu)化,可以針對復雜環(huán)境體系得到全局最優(yōu)解,最終有望跳出原有的試錯法框架?!?/p>
技術加持下,人類科學研究的邊界在哪里
近年來,隨著人工智能算法、大數(shù)據(jù)技術等“火爆”名詞的出現(xiàn),有關“人類能否拓展科學研究邊界”的話題再度回歸。
“物理學領域,人類能夠探究到宇宙的起源和演化,但仍然無法解釋暗物質(zhì)和暗能量的本質(zhì);生命科學領域,我們已經(jīng)能夠破解基因密碼,但無法完全理解生命的起源和演化;社會科學領域,我們能夠通過大數(shù)據(jù)分析來研究人類行為和社會現(xiàn)象,但無法完全預測人類行為的復雜性和多樣性……”姚宏斌說,先進技術為人類探究更深層次的科學問題提供更多可能性和機會。然而,科學探究的邊界并不由技術的發(fā)展所決定,它同時被人類對自然界的認知和理解所限制著。
在他看來,當科學技術不斷發(fā)展,人類可以更深入地探究自然界的奧秘,但科研工作者也需要不斷拓展自身認知和理解,才能更好地理解和解釋自然界的復雜和多樣。
馮毅告訴記者,當發(fā)達的技術解放了科學家的雙手,讓他們有更多的時間去思考,激發(fā)更多創(chuàng)新性成果,大家對于科學的認知也就越深入,就會發(fā)現(xiàn)越來越多的問題和無法解釋的現(xiàn)象可以繼續(xù)探索。
喬欽禹也認為人類的科學探究沒有邊界。他說:“先進技術的出現(xiàn),就是讓我們不斷地拓展邊界。相應的,有關部門應該給予坐‘冷板凳’的年輕人更多物質(zhì)上和精神上的支持。對知識的渴求,永遠是人類前進的動力之一?!?/p>
江俊的觀點是懷抱更開放的胸懷和心態(tài)去提升自我。他說:“現(xiàn)階段的科研知識樹已經(jīng)無比龐大,沒有人能看到全局,我們應該找到自己喜歡的葉面。在任何一個專業(yè),在自身專業(yè)領域把知識脈絡看清楚,精準、扎實掌握知識精髓。”
幾年來,他學習了很多新知識,甚至試著向本科生學習弄清一些新問題,開組會時,他甚至插不上嘴,只提供方向上的指導。
肖恒宇覺得,如果科學探究的邊界一詞是指科學的前沿,那么科學研究本身就是在不斷拓展科學的邊界、加強人類對自然的認知過程;如果科學探究的邊界一詞是指人類科學不能超越的限制,該限制或許就代表人類目前所能觀測到的自然現(xiàn)象的集合,當人類所創(chuàng)造的理論、預測的自然現(xiàn)象超越了這個集合之后,就無法證實或證偽理論,使得理論失去現(xiàn)實意義。
“當討論話題回到原點,其實人工智能是典型的問題驅(qū)動學科,相關研究尚處于初級階段?;瘜W研究的體系是獨特且復雜的,看似簡單的化學反應,影響因素涉及分子結構、材料性質(zhì)等?!崩钫鹩詈粲?,應該研發(fā)專門服務于精準化學研究的人工智能新算法,發(fā)展先進的理論計算與實驗表征方法,細化到溫度、壓強、分子式等各種參數(shù),必將大幅提升化學研究效率。
他進一步解釋道:“科學研究本身就是在不斷拓展邊界、加強人類對自然的認知過程。精密的儀器、高性能的計算方法、人工智能等先進技術能夠幫助人們更快、更好地進行科研探索,在可預見的將來加速擴大科學研究的邊界?!?/p>
中青報·中青網(wǎng)記者 王海涵 來源:中國青年報
版權聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權歸高原(北京)文化傳播有限公司。任何媒體轉載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關法律責任。