需要研究假設嗎?問AI。 |麻省理工學院新聞

對任何科學家來說,制定獨特而有前途的研究假設都是一項基本技能。這也可能很耗時:新的博士候選人可能會花費他們計劃的第一年,試圖確定在實驗中要探索什麼。如果人工智能可以幫助您怎麼辦?

麻省理工學院的研究人員創造了一種通過人類協作來自主生成和評估各個領域的有希望的研究假設的方法。在新論文中,他們描述瞭如何使用該框架來創建與生物學啟發材料領域未滿足的研究需求保持一致的證據驅動的假設。

週三出版 高級材料這項研究由原子和分子力學實驗室的博士後Alireza Ghafarollahi(LAMM)和Markus Buehler,Markus Buehler,MIT工程學的傑里·麥克菲(Jerry McAfee)教授,在MIT的工程學領域,民用和環境工程系,蘭姆。

研究人員稱之為Sciagents的框架由多個AI代理組成,每個代理都具有特定的功能和對數據的訪問,這些框架利用了“圖形推理”方法,其中AI模型利用了一個知識圖,該知識圖可以組織和定義多樣化的科學概念之間的關係。多機構方法模仿了生物系統將自己作為基本構建基礎組組織的方式。布勒指出,從材料到眾多昆蟲到文明,這一“分歧和征服”原則在生物學上是一個重要的生物學範式 – 所有的例子都比個人能力總和要大得多。

“通過使用多個AI代理,我們正在嘗試模擬科學家社區發現的過程,” Buehler說。 “在麻省理工學院,我們通過有一群背景不同的人一起工作,並在咖啡店或麻省理工學院的無限走廊互相碰撞來做到這一點。但這是非常巧合和緩慢的。我們的追求是通過探索AI系統是否可以創造性並進行發現來模擬發現過程。”

自動化好主意

正如最近的發展所表明的那樣,大型語言模型(LLMS)表現出令人印象深刻的回答問題,匯總信息和執行簡單任務的能力。但是,從頭開始生成新想法時,它們非常有限。麻省理工學院的研究人員希望設計一個使AI模型執行更複雜,多步驟過程的系統,該過程不僅僅是回憶在培訓期間學習的信息,還可以推斷和創造新知識。

他們方法的基礎是一個本體論知識圖,該圖形組織並建立了各種科學概念之間的聯繫。為了製作圖形,研究人員將一組科學論文餵入生成的AI模型。在先前的工作中,布勒使用了一個數學領域,稱為類別理論來幫助AI模型開發科學概念作為圖形的抽象,植根於定義組件之間的關係,以一種可以通過稱為圖形推理的過程來分析的方式,該方式可以分析。 。這將AI模型重點放在開發一種更有原則的方法來理解概念的方法上。它還使他們能夠在跨域中更好地概括。

Buehler說:“這對於我們創建以科學為中心的AI模型非常重要,因為科學理論通常植根於可概括的原則而不僅僅是知識回憶。” “通過以這種方式將AI模型集中在’思維上’上,我們可以超越傳統方法,並探索對AI的更多創造用途。”

在最近的論文中,研究人員使用了大約1000種關於生物材料的科學研究,但Buehler表示,可以使用任何領域的研究論文或更少的研究論文來生成知識圖。

建立了圖表後,研究人員開發了一個用於科學發現的AI系統,多種模型專門在系統中扮演特定的角色。大多數組件都是建立在OpenAI的ChatGpt-4系列模型上的,並利用了一種稱為“文本學習的技術”,其中提示提供了有關該模型在系統中的作用的上下文信息,同時允許其從提供的數據中學習。

框架中的個別代理相互互動,共同解決了一個複雜的問題,而他們都無法獨自做。他們給出的第一個任務是產生研究假設。 LLM交互開始是在從知識圖定義的子圖後開始的,知識圖可以隨機發生,也可以通過手動輸入論文中討論的一對關鍵字。

在框架中,研究人員稱之為“本體學家”的語言模型的任務是定義論文中的科學術語並檢查它們之間的聯繫,並散發出知識圖。然後,一個名為“科學家1”的模型基於諸如揭示意外特性和新穎性的能力之類的因素來製定一項研究建議。該提案包括討論潛在發現,研究的影響以及對基本行動機制的猜測。 “科學家2”模型擴展了這個想法,提出了特定的實驗和模擬方法並進行了其他改進。最後,“批評家”模型強調了其優勢和劣勢,並提出了進一步的改進。

布勒說:“這是建立一個並非所有人都以相同方式思考的專家團隊。” “他們必須以不同的方式思考並具有不同的能力。批評家經過了故意編程以批評其他人,因此您並沒有讓所有人都同意並說這是一個好主意。您有一個經紀人說:“這裡有一個弱點,您能解釋更好嗎?”這使輸出與單個模型大不相同。”

系統中的其他代理能夠搜索現有文獻,該文獻為系統提供了一種方法,不僅可以評估可行性,還可以創建和評估每個想法的新穎性。

使系統更強

為了驗證他們的方法,Buehler和Ghafarollahi建立了一個基於“絲綢”和“能量密集型”字樣的知識圖。使用該框架,“科學家1”模型提出了將絲綢與蒲公英的色素整合在一起,以創建具有增強的光學和機械性能的生物材料。該模型預測,該材料將比傳統的絲綢材料強大,並且需要更少的能量來處理。

然後,科學家2提出了建議,例如使用特定的分子動態模擬工具來探索擬議材料如何相互作用,並補充說,材料的良好應用將是生物啟發的粘合劑。然後,評論家模型強調了提議的材料和改進領域的幾個優勢,例如其可伸縮性,長期穩定性以及溶劑使用的環境影響。為了解決這些問題,批評家建議進行試點研究,以進行過程驗證並對物質耐用性進行嚴格的分析。

研究人員還使用隨機選擇的關鍵字進行了其他實驗,該實驗對更有效的仿生微流體芯片產生了各種原始假設,增強了基於膠原蛋白的腳手蛋白的機械性能,以及石墨烯和澱粉樣纖維之間的相互作用,以創建生物電子設備。

Ghafarollahi說:“該系統能夠根據知識圖的路徑提出這些新的,嚴格的想法。” “就新穎性和適用性而言,這些材料似乎是強大而新穎的。在將來的工作中,我們將產生成千上萬或成千上萬的新研究思想,然後我們可以對它們進行分類,嘗試更好地了解這些材料的產生方式以及如何進一步改進。”

展望未來,研究人員希望將新的工具納入將信息和運行模擬的新工具納入其框架中。他們還可以輕鬆地將基礎模型交換為更高級的模型,從而使系統適應了AI中最新的創新。

Buehler說:“由於這些代理的相互作用的方式,即使是輕微的一個模型的改進,也對系統的整體行為和輸出產生了巨大影響。”

自從釋放出具有其方法的開源細節的預印本以來,研究人員已與有興趣在不同科學領域甚至金融和網絡安全等領域中使用框架的人聯繫研究人員。

布勒說:“您可以做很多事情,而無需去實驗室。” “您希望基本上在過程結束時去實驗室。該實驗室很昂貴,需要很長時間,因此您需要一個可以深入了解最佳想法的系統,制定最佳假設並準確預測出現的行為。我們的願景是使其易於使用,因此您可以使用應用程序引入其他想法或在數據集中拖入數據集,以真正挑戰模型以做出新發現。”

Source link

Scroll to Top