圖生成的高階引導性擴散:一種保存拓撲結構的粗到精細方法

圖生成是一個複雜的問題,涉及構建結構化的非歐國人表示,同時保持實體之間有意義的關係。大多數當前方法無法捕獲分子建模,社交網絡分析和蛋白質設計應用所需的高階相互作用,例如基序和簡單複合物。最初開發的用於圖像合成的基於擴散的方法已在應用領域廣泛普及,但往往會失去重要的拓撲信息。整個擴散的結構依賴性的快速衰減導致圖形輸出不切實際。其次,傳統方法將各向同性高斯噪聲添加到鄰接矩陣中,從而破壞了諸如稀疏和連通性之類的關鍵特性。為了克服這些問題,需要在整個圖生成中具有高階結構指導的方法來保留更高的拓撲完整性。

當前的圖形生成模型基於諸如復發性神經網絡,變異自動編碼器和生成對抗網絡等方法。儘管這樣的方法可以學習結構屬性,但它們在計算上卻昂貴,並且缺乏可擴展性。最近,已經提出了基於擴散的框架,以逐步逐步改善圖形。儘管這樣的模型提供了一些改進,但它們固有地用於連續圖像數據,因此無法捕獲圖形的離散和層次結構。當前方法的一個主要弱點是在擴散幾步之後,在鄰接矩陣中破壞了有意義的結構,從而導致圖形的隨機,不現實的表示。此外,這些模型通常不可超數,因為它們在置換節點時無法保持一致性,從而導致圖形分佈的估計不准確。

為了應對這些挑戰,Hog-Diff基於粗到精細的學習範式介紹了一種系統的方法,該方法逐漸以保持關鍵拓撲特徵的方式逐步完善圖形。通過將生成過程分解為連續的步驟,該方法首先構建高階圖形骨骼,然後進行成對關係和復雜細節的完善。中間階段的擴散橋機構保持正確組織的中間步驟和現實的中間表示,而不會丟失詳細的拓撲特徵。與傳統方法(通過操縱鄰近矩陣起作用)相反,該範式在拉普拉斯矩陣的特徵值空間中利用頻譜擴散。該過程抑制了連通性模式過多的修改,從而導致更具結合的輸出。此外,模型體系結構使用與圖形變壓器網絡集成的圖形卷積網絡,以了解本地化關係和全局依賴性,從而使改進的模型性能一般。

生成過程使用結構化的多階段體系結構,每個階段都在不消除其高階功能的情況下完善圖形。利用使用細胞複合物的過濾過程消除無助的節點和邊緣,以實現這種受控的圖形結構。擴散過程由廣義的Ornstein-Uhlenbeck橋控制,通過數學確保了從一種結構排列到另一種結構排列的平穩過渡。光譜擴散通過將擾動注入Laplacian矩陣的特徵值空間,取代了鄰接矩陣中傳統的噪聲注入方法,從而保留了重要的連通性和稀疏模式。模型架構通過使用圖形卷積和變壓器網絡的集成來捕獲跨尺度的信息特徵,從而提供了局部和全局結構之間的平衡。

大規模的實驗驗證了與分子和通用圖生成任務的最先進方法相比,豬-DIFF的性能更好。在分子空間中應用的背景下,該模型在主要相似性度量方面具有顯著程度的性能,例如較低的鄰域子圖成對距離內核和FréchetChemnet距離分數,從而反映了與現實分子分佈的較高一致性。更高的有效性,獨特性和新穎性得分進一步證明了其產生化學有意義的結構的能力。除了分子圖的特定背景外,該模型還顯示了在通用數據集中提取複雜拓撲依賴性的無與倫比的能力,從而在度分佈,聚類係數和軌道結構精度方面達到了較低的錯誤率。在生成轉化期間維護高階特徵會導致生成圖形,這些圖形不僅具有現實主義,而且在結構上穩定,提供了比現有實踐更可靠的解決方案。

通過將高階結構信息直接集成到生成模型中,Hog-Diff提供了一個改進的解決方案,以克服傳統擴散模型的局限性。粗到1的生成策略,擴散橋操作和光譜擴散的整合確保生成的圖保持了拓撲忠誠度和語義正確性。對不同數據集的大規模評估證實了其能夠以改善結構正確性生成高質量圖的能力。對各種拓撲指南的系統探索可提高解釋性,使該框架成為從藥物發現和城市建模到網絡科學的應用中的寶貴工具。維護高級圖結構,該方法證明了對結構化數據的深層生成建模的重要進步。


查看 紙。 這項研究的所有信用都歸該項目的研究人員。另外,請隨時關注我們 嘰嘰喳喳 而且不要忘記加入我們的 75K+ ml子雷迪特

🚨 推薦的開源AI平台:’Intellagent是一個開源多代理框架,可評估複雜的對話性AI系統(晉升)


Aswin AK是Marktechpost的諮詢實習生。他正在印度科技學院哈拉格布爾(Kharagpur)攻讀雙重學位。他對數據科學和機器學習充滿熱情,為解決現實生活中的跨域挑戰帶來了強大的學術背景和動手經驗。

🚨推薦開源AI平台:“ Intellagent是一個開源的多代理框架,可評估複雜的對話AI系統”(已晉升)

Source link

You might also enjoy

Subscribe Our Newsletter

Scroll to Top