生物醫學研究人員在尋求科學突破時面臨著嚴重的困境。生物醫學主題的複雜性日益複雜,需要深入,專業的專業知識,而變革性的見解通常會在不同學科的交集中出現。深度和廣度之間的這種張力為科學家帶來了重大挑戰,該科學家在成倍增長的出版物和專業的高通量技術方面逐漸增長。儘管存在這些障礙,但主要的科學進步經常源於跨學科的方法,包括CRISPR的發展,CRISPR的發展是例證了這種模式,結合了微生物學,遺傳學和分子生物學的技術。這樣的例子突出了傳統界限如何促進科學進步,即使研究人員努力保持專業知識和跨學科意識。
最近的方法著重於開發專門的“推理模型”,這些模型試圖擅長人類思維過程,而不是簡單地預測下一個單詞。測試時間計算範式已成為一個有希望的方向,在推斷過程中分配了其他計算資源以實現故意推理。這個概念從Alphago的Monte Carlo Tree搜索等早期成功發展,並已擴展到LLMS。同時,AI已改變了跨領域的科學發現,例如Alphafold 2在蛋白質結構預測中的突破。現在,研究人員旨在將AI整合到研究工作流程中,並希望在整個科學過程中建立AI作為積極的合作者,從假設產生到手稿寫作。
此外,已經出現了各種AI系統,以加速生物醫學研究中的科學發現。 Coscientist是GPT-4驅動的多代理系統,可以通過集成的Web搜索和代碼執行功能自主執行化學實驗。此外,諸如GPT-4和專業生物醫學LLM(例如Med-palm)的通用模型在生物醫學推理基准上都表現出了令人印象深刻的性能。在藥物重新利用時,傳統方法使用疾病與藥物相互作用的理解結合了計算方法和實驗方法。基於圖形的方法(例如圖形卷積網絡和TXGNN)表現出希望,但仍受到知識圖質量,可擴展性問題和不足的解釋性的限制。
Google Cloud AI Research,Google Research,Google DeepMind,Houston Methodome,Sequome,Fleming Initiative和London帝國學院的研究人員和Stanford University醫學院提出了AI共同科學家,這是一種基於Gemini 2.0的多機構系統,該系統旨在加速科學發現。它旨在發現新知識並產生新的研究假設與科學家提供的目標保持一致。使用“生成,辯論和進化”方法,AI共同科學家使用測試時間計算縮放來改善假設的產生。此外,它重點介紹了三個生物醫學領域:藥物重新利用,新的靶標發現和細菌進化機制的解釋。自動化評估表明,增加測試時間計算始終如一地提高了假設質量。
AI共同科學架構集成了四個基本組成部分,形成了一個全面的研究系統:
- 自然語言界面使科學家能夠與系統互動,定義研究目標,提供反饋並通過對話輸入指導進展。
- 異步任務框架實現了多代理系統,其中專用代理在連續執行環境中充當工作過程。
- 主管代理通過管理工人任務隊列,將專業代理分配給流程和分配計算資源來策劃上述框架。
- 為了在長期範圍內實現迭代計算和科學推理,共同科學家使用持續的上下文記憶來存儲和檢索計算過程中代理和系統的狀態。
AI共同科學系統的核心是由主管代理商精心策劃的專業代理聯盟。有多種類型的專業代理。從發電代理開始,它通過創建初始焦點領域和假設來啟動研究。此外,反射劑是同伴審稿人,批判性地檢查了假設質量,正確性和新穎性。排名代理通過成對比較實現基於ELO的比賽系統,以評估和優先考慮假設。接近代理計算假設聚類,重複數據刪除和對概念景觀有效探索的相似圖。進化劑不斷完善排名最高的假設。最後,Meta-Review代理合成了所有評論和比賽辯論中的見解,以在隨後的迭代中優化代理性能。
AI共同科學系統在多個評估指標中顯示出強大的性能。使用GPQA鑽石組的分析顯示了ELO評級和準確性之間的一致性,並且系統通過為每個問題選擇其最高評級結果來實現78.4%的TOP-1準確性。此外,諸如Openai O3-Mini-High和DeepSeek R1之類的新推理模型顯示出競爭性能,而合作科學家則沒有表現出績效飽和的證據,這表明進一步的擴展可以帶來額外的改進。共11個研究目標的專家評估證實了共同科學家的有效性,與基線模型相比,產出獲得最高的偏好排名(2.36/5)和優越的新穎性(3.64/5)和影響(3.09/5)的評級。
AI共同科學家在多個生物醫學研究領域的進一步結果表現出顯著的能力。在肝纖維化研究中,當要探索表觀遺傳改變時,該系統會產生15個假設。這些假設將3種新型的表觀遺傳修飾劑確定為潛在的治療靶標,並得到臨床前證據的支持。隨後在肝癌中進行的測試證實,針對這些修飾劑的兩個藥物表現出抗纖維化活性而無需細胞毒性。值得注意的是,一種已鑑定的化合物已經被FDA批准了另一種跡象,並立即為肝纖維化治療提供了立即的藥物重新利用機會。在抗微生物抗性研究中,共同科學家精確地提出了研究衣殼尾巴相互作用,與研究人員發現CF-PICIS與各種噬菌體尾巴相互作用以擴大其宿主範圍,這與研究人員的發現完全一致。
這篇研究論文還提供了AI共同科學家系統所面臨的限制:
- 文獻搜索,評論和推理的局限性。
- 缺乏訪問負面結果數據。
- 改進的多模式推理和工具使用功能。
- Frontier LLMS的繼承局限性。
- 需要更好的指標和更廣泛的評估。
- 現有驗證的局限性。
AI共同科學家目前尚未旨在生成全面的臨床試驗設計,也不是為了充分說明諸如藥物生物利用度,藥代動力學和任何復雜的藥物相互作用之類的因素。
AI共同科學系統為許多機會提供了很多機會 未來的發展 在幾個方面。即時的改進應著重於增強文學審查,實施外部工具交叉檢查,加強事實驗證以及改善引文召回以解決錯過的研究。連貫檢查還將減輕審查缺陷假設的負擔。一個重大進步將涉及擴展文本分析以合併圖像,數據集和主要公共數據庫。最後,與實驗室自動化系統的集成可以創建閉環驗證週期,而更結構化的用戶界面可以提高人類AI協作效率,而不是當前的自由文本交互。
在 結論研究人員介紹了AI共同科學家,這是一種多代理系統,以通過代理AI系統加速科學發現。該系統使用其“生成,辯論,進化”方法與專門的代理商一起使用,該系統具有增強人類科學努力的巨大潛力。跨多個生物醫學領域的實驗驗證證實了其產生可承受現實審查的新型可檢驗假設的能力。隨著科學家在人類健康,醫學和更廣泛的科學領域面臨越來越複雜的挑戰,諸如AI共同科學家之類的系統提供了有意義的發現過程加速。這種以人為中心的AI發展為幫助人類有效地解決重大科學挑戰的新機會。
查看 紙。 這項研究的所有信用都歸該項目的研究人員。另外,請隨時關注我們 嘰嘰喳喳 而且不要忘記加入我們的 80k+ ml子列數。
🚨 推薦的閱讀-LG AI研究釋放Nexus:一個高級系統集成代理AI系統和數據合規性標準,以解決AI數據集中的法律問題

Sajjad Ansari是來自IIT Kharagpur的最後一年的本科生。作為技術愛好者,他深入研究了AI的實際應用,重點是理解AI技術及其現實世界的影響。他旨在以清晰易於的方式表達複雜的AI概念。
🚨推薦開源AI平台:“ Intellagent是一個開源的多代理框架,可評估複雜的對話AI系統”(已晉升)