Onur Boyar的訪談:使用生成模型和貝葉斯優化的藥物和材料設計

在此訪談系列中,我們會遇到一些AAAI/Sigai博士聯盟參與者,以了解有關他們的研究的更多信息。 Onur Boyar是Nagoya大學的博士生,從事生成模型和貝葉斯材料和藥物設計方法。我們遇到了Onur,以了解有關他的研究項目,方法論和與化學家合作的更多信息。

您能否開始快速介紹您正在學習的地方和研究的廣泛主題?

我來自土耳其,三年前我來到日本攻讀博士學位。到達這里之前,我已經對生成模型,貝葉斯方法和馬爾可夫鏈蒙特卡洛技術感興趣。由於日本在生物信息學和AI與生命科學的交集中享有很高的聲譽,因此我渴望探索與生物信息相關問題的應用研究。我的教授建議使用生成模型和優化技術從事藥物和材料設計。事實證明,這非常適合我,尤其是因為該研究領域在很大程度上依賴於貝葉斯方法,我想深入研究。自2022年以來,我一直在研究用於發現藥物的優化和生成方法。一路上,我們開發了幾種分子和晶體材料設計的新方法。

您能告訴我們您在博士學位期間一直從事的項目嗎?

因此,我在博士學位期間一直從事的主要項目之一是日本大型Moonshot計劃的一部分 – 這是一項由政府資助的倡議,具有相當雄心勃勃的目標。這個想法最終是建立一個可以自行處理整個藥物發現和開發過程的AI科學家機器人。我們的團隊專注於開發該系統的AI部分。第一步是與化學家合作完成藥物開發週期。

這是主要項目,但我也參與了其他項目。例如,我們最近開始與一些有關特定疾病的藥物發現的化學家合作。我們還使用我們的生成水晶材料的方法與幾家公司解決材料科學問題。

每個項目都有自己的挑戰,需要採取略有不同的方法。早期,當我們生成候選分子進行藥物發現時,化學家告訴我們,他們正在努力實際合成分子,因為AI傾向於產生在實踐中難以解釋或使用的結構。因此,他們問我們是否可以開發一種編輯現有分子而不是生成全新分子的方法。這樣,他們將使用他們已經熟悉的結構,但對更好的屬性進行了優化。方法的轉變確實有所幫助 – 我們已經看到了一些成功。我們設計的一些分子已經顯示出有希望的特性,有些甚至正在進行動物測試。藥物開發是一個漫長而復雜的過程,但我們肯定會取得進步。

您是否特別喜歡一個特定的項目?

是的,實際上,這是我剛才提到的項目。對我來說,這是最令人興奮的,因為我會看到現實世界的影響。我發送我們生成的分子,化學家實際上試圖綜合它們 – 這部分確實很有意義。這讓我覺得自己為科學做出了真正的貢獻。與化學家緊密合作,獲得反饋,看到他們發現有前途的分子並知道有些實際上是在生產的,這也很棒。我最喜歡的那種動手,實用的一面。

您能告訴我們更多有關此項目方法的信息嗎?

當然!因此,首先,我們與我的博士主管,顧問和化學家合作者進行了許多深入的討論。他們非常清楚他們想要保存的分子的哪些部分以及哪種結果對它們最有用。根據他們的輸入,我的主要目標是開發樣品效率的方法。從理論上講,可能可以產生和測試數千個分子,但是實際上,由於時間和預算的限制,這是不可行的。

鑑於現有的分子已知對某種疾病有效(例如Covid-19),我們開發了使用分子編輯框架進一步增強其有效性的方法,該框架將生成模型與優化技術相結合,稱為潛在太空貝葉斯優化。在圖中,QED是指該分子的吸毒評分,這是其用作藥物的潛力的估計。通過在每個步驟執行小的,有針對性的修改,我們的目標是最大化該值。

為了解決這個問題,我轉向貝葉斯優化,這非常適合從有限的樣本中獲得最大收益。具體來說,我圍繞潛在太空貝葉斯優化構建了方法。分子是離散和高維結構,因此我們使用自動編碼器將其映射到較低維,連續的潛在空間中。這使優化更加易於管理。

該模型沒有從頭開始生成全新的分子,而是提出了針對性的小修改(例如在現有分子中添加小片段),甚至學習最好地將它們固定在哪裡。這種方法使我們能夠生成不僅針對所需特性進行優化的候選者,而且對化學家來說也更容易合成。

潛在太空貝葉斯優化(LSBO)的圖。 LSBO是一種通過在由變異自動編碼器(VAE)等生成模型創建的簡化,壓縮的空間中工作來優化昂貴的黑盒功能(例如分子對蛋白質的有效性)的技術。首先,使用VAE的編碼器將輸入示例編碼為一個稱為潛在向量的緊湊型表示。使用這些潛在向量及其相應的函數值訓練了替代模型(例如高斯過程)。然後,在這個潛在空間中進行貝葉斯優化,以提出新的有前途的潛在向量。將其解碼為一個新的輸入示例,該示例使用原始的Black-Box函數進行評估。該過程重複,可以在潛在空間中而不是直接在復雜的輸入空間中進行有效的探索和優化。

該項目在與化學家的合作方面如何工作?

該項目在一種週期中起作用。化學家首先向我們發送一些目標信息 – 基本上是他們的目標 – 然後我們基於此生成一組候選分子。他們選擇一些來合成,如果原來有希望,他們可能會要求我們進一步改進它。在下一輪中,我們的算法將該分子作為輸入,並試圖更優化它。

然後,我們向他們發送更新的候選人,然後他們進入下一輪合成。這個週期一直持續到化學家對結果感到滿意為止。每個週期通常至少需要四個月,因此這是一個漫長的過程,但是它是協作和迭代的,我認為這是項目的優勢之一。

我了解您將很快完成博士學位。畢業後,您是否有排隊的位置?

是的,我實際上現在正在寫論文。我計劃在大約兩個月內提交,並在八月左右辯護。之後,我將在東京的IBM研究中開始職位。我在去年年底在那裡實習,這是一次很棒的經歷 – 我學到了很多東西,這導致了這個機會在畢業後全職加入他們。

目前,我總部位於日本中部的名古屋。乘彈列車只有大約一個半小時到東京,所以我將在八月或九月左右搬到那裡。我將要進行的項目與我當前的研究密切相關。我將加入材料發現團隊,並將開髮用於化合物和材料的物業預測模型 – 因此,這是我在博士學位期間一直在做的事情的很好的延續。

繼續談論AAAI會議。博士聯盟和會議的一般經驗如何?

實際上,這是我第一次參加如此大的會議,也是我在美國第一次參加會議 – 因此整個體驗真的很令人興奮。博士聯盟超級組織良好。在早晨,我們與來自學術界和工業的教授和研究人員進行了指導。他們對自己的建議確實很慷慨,並從自己的經歷中分享了許多有用的見解。

結識其他博士生也很棒。我們大多數人都處於類似的階段 – 接近完成 – 老實說,聽到每個人都在處理接下來會發生的事情的不確定性。除了研究之外,我們還談到了攻讀博士學位的心理方面。就我個人而言,我認為這比純粹的學術挑戰更像是一種精神挑戰,因此能夠公開談論這確實是有價值的。

還有一些不錯的社交活動 – 共享午餐和晚餐 – 我們可以隨意地聯繫。在海報會議上,我與對我的工作真正感興趣的人進行了一些很好的對話,試圖了解別人的工作很有趣。主題的範圍是超級多樣的,我帶著許多新想法離開了它。我真的很喜歡這個程序,並且已經將其推薦給實驗室中的每個人。

除了博士聯盟外,我還接受了AAAI的另一篇論文 – 該論文在“ AI加速科學與工程”研討會上。不幸的是,由於與另一屆會議的衝突,我無法參加研討會。

至於主要會議,我必須參加一些海報會議和主題演講。這很鼓舞人心,也給了我未來的一些方向。現在,許多人正在研究大型語言模型和AI推理,因此我開始考慮如何將這些想法帶入自己的研究中,尤其是在科學發現的背景下。

您如何發現Alphafold改變了您所在地區的研究格局?

Alphafold實際上對我們的工作產生了很大的影響。在我們的分子設計項目中,我們專注於創建可以與靶蛋白良好相互作用的化合物 – 因此具有良好的綁定親和力是關鍵。我們不是自己進行濕實驗室實驗;一切都發生在模擬環境中,這些模擬依賴於預測的三維蛋白質結構。這就是Alphafold進入的地方 – 我們使用它預測的結構作為我們優化過程的輸入。

我不是直接處理Alphafold(該部分是由其他研究人員處理的),但我們的結果實際上取決於這些預測的準確性。如果Alphafold給我們提供較差的蛋白質結構,我們的分子設計也不會非常有效。

總體而言,Alphafold確實推動了領域的前進。它使蛋白質結構預測更加易於訪問,幫助我們的地區發展,並引起了更多的關注和資金,這無疑有所幫助。

最後的問題,您在AI之外有任何有趣的愛好或興趣嗎?

是的,我真的很喜歡一級方程式賽車 – 我盡可能地嘗試參加比賽,而且我也做一些模擬人數。我也很喜歡拳擊。我年輕的時候我曾經做過盒子,在日本的頭兩年裡,我再次撿起它,但隨後受傷了,所以我不得不休息一下。我希望盡快捲土重來!之前,我提到了博士學位如何在精神上具有挑戰性,我覺得拳擊是一樣的 – 不僅僅是體力。這也是關於您能保持冷靜,閱讀對手並在非常激烈的環境中管理情緒的能力。只有您和另一個人在一個很小的空間中 – 非常心理。那是我喜歡的事情之一。

關於Onur

Onur Boyar 是日本名古屋大學的博士候選人,也是Riken的研究人員。他的研究重點是使用生成模型,潛在空間表示以及高級優化技術(例如貝葉斯優化)的新分子和晶體的設計。在獲得博士學位之前,他曾在幾家公司擔任數據科學家,從而獲得了應用機器學習的實踐經驗。他從土耳其的Boğaziçi大學獲得了學士學位和碩士學位。 Onur對利用AI加速科學發現充滿熱情,尤其是在化學和材料科學領域。

標籤:AAAI,AAAI博士財團,AAAI2025,ACM Sigai


露西·史密斯(Lucy Smith)是Aihub的高級執行編輯。

Source link

Scroll to Top