LIRA: जैविक अनुक्रम मॉडलिंग के लिए गणना करने वाला सबक्वेडेंटिक आर्किटेक्चर

सीएनएन और ट्रांसफार्मर जैसे डीप लर्निंग आर्किटेक्ट स्थानीय और लंबी दूरी की निर्भरता को धारण करके काफी उन्नत जैविक अनुक्रम मॉडलिंग हैं। हालांकि, जैविक संदर्भों में उनके आवेदन को उच्च गणना मांग और बड़े डेटासेट की आवश्यकता से अवरुद्ध किया जाता है। सीएनएन स्थानीय अनुक्रम प्रभावी रूप से सबक्विटेरियन स्केलिंग के साथ पैटर्न का पता लगा रहे हैं, जबकि ट्रांसफॉर्मर वैश्विक इंटरैक्शन को मॉडल के लिए स्व-ध्यान का लाभ देते हैं, लेकिन चतुर्भुज स्केलिंग की आवश्यकता होती है, जिससे इसकी गणना की जाती है। हाइब्रिड मॉडल, जैसे कि एनफोर्सर्स, स्थानीय और अंतर्राष्ट्रीय संदर्भ मॉडलिंग को संतुलित करने के लिए सीएनएन और ट्रांसफार्मर को एकीकृत करते हैं, लेकिन वे अभी भी स्केलेबिलिटी मुद्दों का सामना करते हैं। अल्फाफोल्ड 2 और ईएसएम 3 सहित बड़े-आधारित ट्रांसफार्मर-आधारित मॉडल ने प्रोटीन संरचना के पूर्वानुमान और अनुक्रम-फ़ंक्शन मॉडलिंग में सफलता हासिल की है। फिर भी, व्यापक आयाम स्केलिंग पर उनकी निर्भरता जैविक प्रणालियों में उनकी कार्यक्षमता को सीमित करती है जहां डेटा की उपलब्धता अक्सर प्रतिबंधित होती है। यह मॉडल सटीक रूप से मॉडल अनुक्रम-से-फ़ंक्शन संबंधों के लिए अधिक गणनात्मक कुशल दृष्टिकोणों की आवश्यकता पर प्रकाश डालता है।

इन चुनौतियों को दूर करने के लिए, एपिस्टेसिस के बीच बातचीत – क्रम में परिवर्तन – जैविक अनुक्रम मॉडलिंग के लिए एक संरचित गणितीय संरचना प्रदान करती है। मल्टीलेनर बहुविवाह इन इंटरैक्शन को पेश कर सकता है, जो अनुक्रम-फ़ंक्शन संबंधों को समझने के सिद्धांत के सिद्धांत की पेशकश करता है। राज्य अंतरिक्ष मॉडल (एसएसएम) स्वाभाविक रूप से बहु -संबंधी संरचना के साथ समायोजित करता है, लगभग एपिस्टैटिक प्रभावों के लिए छिपे हुए मापदंडों का उपयोग करता है। ट्रांसफॉर्मर के विपरीत, एसएसएम सबक्विटेरियन स्केलिंग को बनाए रखते हुए वैश्विक निर्भरता को प्रभावी ढंग से मॉडल करने के लिए एक त्वरित फुंसी ट्रांसफॉर्म (एफएफटी) का उपयोग करता है। इसके अलावा, गेटेड डेप्थ टेंड्रिविस कन्व्यूशन को एकीकृत करना अनुकूली सुविधा चयन द्वारा स्थानीय सुविधा निष्कर्षण और अभिव्यक्ति को बढ़ाता है। यह हाइब्रिड दृष्टिकोण व्याख्या के साथ गणना दक्षता को संतुलित करता है, जिससे यह जैविक अनुक्रम मॉडलिंग के लिए ट्रांसफार्मर-आधारित आर्किटेक्ट्स के लिए एक आशाजनक विकल्प बन जाता है।

एमआईटी, हार्वर्ड और कार्नेगी मेलन सहित संगठनों के शोधकर्ता, जैविक कार्यक्रमों के लिए डिज़ाइन किए गए एक उप -अनुक्रमिक अनुक्रम मॉडलिंग आर्किटेक्चर लीरा का परिचय देते हैं। लीरा एसएसएम को एकीकृत करता है ताकि स्थानीय सुविधा निष्कर्षण के लिए अनुमानित गेटेड कन्वेंशन के साथ लंबी दूरी की निर्भरता प्राप्त हो सके, जिससे कुशल ओ (एन लॉग एन) स्केलिंग सक्षम हो। यह प्रभावी रूप से एपिस्टैटिक इंटरैक्शन को मॉडल करता है और 100 से अधिक जैविक कार्यों में परिष्कृत संचालन को प्राप्त करता है, जिसमें प्रोटीन फिटनेस पूर्वानुमान, आरएनए फ़ंक्शन विश्लेषण और CRISPR गाइड डिजाइन शामिल हैं। लीरा काफी कम आयामों के साथ काम करता है – जो मौजूदा मॉडलों की तुलना में 120,000 गुना छोटा है – जबकि अनुमान 64.18 गुना तेज है, उन्नत जैविक अनुक्रम मॉडलिंग का लोकतंत्रीकरण।

लीरा में दो प्रमुख तत्व होते हैं: एक राज्य-हड़ताली स्तर के साथ अनुमानित गेटेड कनवल्यूशन (पीजीसी) ब्लॉक और गहराई बंदीवाइस कनवल्यूशन (S4D)। लगभग 55,000 आयामों के साथ, मॉडल में स्थानीय निर्भरता को पकड़ने के लिए दो पीजीसी ब्लॉक शामिल हैं, इसके बाद लंबे समय तक मॉडलिंग के लिए एक S4D परत है। 1 डी कन्वेंशन और रैखिक अनुमानों को लागू करके और तत्व -मिवर गुणन द्वारा सुविधाओं को पुनर्व्यवस्थित करके, पीजीसी इनपुट अनुक्रमों को मध्यवर्ती मापदंडों, गहराई से प्रस्तुत करके। कर्ण S4D मैट्रिकिस A, B और C का उपयोग करके कन्वेशन कर्नेल की गणना करने के लिए राज्य-व्यापी मॉडल का लाभ देता है, प्रभावी रूप से वजन के वजन के माध्यम से अनुक्रम-व्यापक निर्भरता को कैप्चर करता है और जैविक डेटा को प्रभावी ढंग से मॉडल करने की क्षमता को बढ़ाता है।

लीरा एक अनुक्रम मॉडलिंग आर्किटेक्चर है जिसे जैविक अनुक्रमों में स्थानीय और लंबी दूरी की निर्भरता को प्रभावी ढंग से पकड़ने के लिए डिज़ाइन किया गया है। यह वैश्विक इंटरैक्शन के लिए स्थानीय मॉडलिंग और विकर्ण S4D के लिए PGC को एकीकृत करता है। LIRA प्रोटीन फिटनेस लैंडस्केप पूर्वानुमान और परिवर्तनकारी स्कैनिंग जैसे कार्यों में ट्रांसफार्मर-आधारित मॉडल का उपयोग करके बहु-औपचारिक अभिव्यक्तियों का उपयोग करके जटिल एपिस्टैक्टिक इंटरैक्शन का अनुमान लगाता है। यह विभिन्न प्रोटीनों और न्यूक्लिक एसिड मॉडलिंग अनुप्रयोगों में परिष्कृत सटीकता को प्राप्त करता है, जिसमें विकार पूर्वानुमान, परिवर्तन प्रभाव विश्लेषण और आरएनए-आधारित आरएनए पोलीमरेज़ जांच शामिल हैं, जबकि काफी छोटे आयामों की गणना की जाती है और मौजूदा बड़े पैमाने पर मॉडल की तुलना में कम-गणना की जाती है।

अंत में, LIRA जैविक अनुक्रम मॉडलिंग के लिए एक सबक्विटेरियन आर्किटेक्चर प्रस्तुत करता है, SSMs मल्टीलिनर बहुविवाह कार्यों में प्रभावी रूप से अनुमान लगाता है। यह गणना की मांग को कम करते हुए एपिस्टैक्टिक इंटरैक्शन के सर्वश्रेष्ठ मॉडलिंग को सक्षम करता है। स्थानीय सुविधा निष्कर्षण के लिए PGC को एकीकृत करके, LIRA को 100 से अधिक जैविक कार्यों में परिष्कृत प्रदर्शन प्राप्त होता है, जिसमें प्रोटीन फिटनेस पूर्वानुमान, RNA विश्लेषण और CRISPR गाइड डिजाइन शामिल हैं। यह बहुत कम आयामों की ओर जाता है और तेजी से -बड़े -बड़े -बड़े मॉडल, घंटों में प्रशिक्षण के लिए केवल एक या दो जीपीयू की आवश्यकता होती है। LIRA की दक्षता चिकित्सीय, रोगजनक निगरानी और बायोमेन्यूसिंग एप्लिकेशन के साथ उन्नत जैविक मॉडलिंग लोकतंत्र का परिग्रहण करती है।


जाँच करना कागज़। इस शोध के लिए सभी श्रेय इस परियोजना के शोधकर्ताओं को जाते हैं। इसके अलावा, हमें फॉलो करने के लिए स्वतंत्र महसूस करें ट्विटर और हमसे जुड़ने के लिए मत भूलना 85 k+ ml सबमिटेड


मार्कटेकपोस्ट और आईआईटी मद्रास में एक परामर्श इंटर्न सना हसन, वास्तविक दुनिया की चुनौतियों को पार करने के लिए प्रौद्योगिकी और एआई को लागू करने के बारे में उत्साहित हैं। व्यावहारिक समस्याओं को हल करने में अधिक रुचि के साथ, यह एआई और वास्तविक जीवन समाधानों के चौराहे के लिए एक नया परिप्रेक्ष्य लाता है।

Scroll to Top