नया कम्प्यूटेशनल मॉडल अधिक सटीक एंटीबॉडी संरचनाओं की भविष्यवाणी कर सकता है | मीट न्यूज

बड़े -लैंगुएज मॉडल डेलो के कृत्रिम बुद्धिमत्ता मॉडल के अनुकूल होकर, शोधकर्ताओं ने अपने आदेश से प्रोटीन के गठन की भविष्यवाणी करने की अपनी क्षमता में बहुत प्रगति की है। हालांकि, यह दृष्टिकोण एंटीबॉडी के लिए इतना सफल नहीं रहा है, इस तरह के प्रोटीन में पाए जाने वाले हाइपरवेरीबिलिटी के हिस्से के रूप में।

उस सीमा को पार करने के लिए, MIT शोधकर्ताओं ने एक गणना तकनीक विकसित की है जो बड़ी भाषा मॉडल को एंटीबॉडी संरचनाओं की अधिक सटीक भविष्यवाणियां करने की अनुमति देती है। उनका काम उन लोगों की पहचान करने के लिए लाखों संभावित एंटीबॉडी से गुजर सकता है, जिनका उपयोग SARS -Cove -2 और शोधकर्ताओं को अन्य संक्रामक रोगों के इलाज के लिए किया जा सकता है।

बोनी बर्गर, बोनी बर्गर, बोनी बर्गर, बोनी बर्गर, बोनी बर्गर, बोनी बर्गर, बोनी बर्गर, बोनी बर्गर, बोनी बर्गर बर्गर, MIT’S कंप्यूटर कहते हैं, “हमारी विधि हमें तराजू की अनुमति देती है, जबकि हम वास्तव में हेस्टेक में कुछ सुइयों को पाते हैं।” है, “सिमोन्स प्रोफेसर बोनी बर्जर कहते हैं। विजय के वरिष्ठ लेखकों और लेख और आर्टिफिशियल इंटेलिजेंस लेबोरेटरी (CSAL), और नए अध्ययन में से एक। “अगर हम दवा कंपनियों को गलत चीज़ के साथ नैदानिक ​​परीक्षणों को रोकने में मदद कर सकते हैं, तो यह वास्तव में बहुत सारे पैसे बचाता है।”

एंटीबॉडी के हाइपरवेरेबल क्षेत्रों पर ध्यान केंद्रित करने वाली तकनीक भी व्यक्तिगत लोगों से पूरे एंटीबॉडी संवाददाताओं का विश्लेषण करने की संभावना है। यह उन लोगों की प्रतिरक्षा प्रतिक्रिया का अध्ययन करने में उपयोगी हो सकता है जो एचआईवी जैसी बीमारियों का सुपर जवाब देते हैं, क्योंकि उनके एंटीबॉडी प्रभावी रूप से वायरस को रोकते हैं।

MIT और MHT, MHT, MIT में बायोलॉजिकल इंजीनियरिंग के एक सहयोगी प्रोफेसर। और ब्रायन ब्रायसन, हार्वर्ड के रागन इंस्टीट्यूट के सदस्य, इस सप्ताह दिखाई देने वाले पेपर के एक वरिष्ठ लेखक भी हैं राष्ट्रीय अकादमी विज्ञान की प्रक्रिया। रोहित सिंह, पूर्व सीएसएल रिसर्च विजय। जनीक, जो अब ड्यूक विश्वविद्यालय में बायोस्टास्ट्रिक्स और बायोस्टास्टिक और सेल बायोलॉजी के सहायक प्रोफेसर हैं, और चिहो आईएम ’22 पेपर के मुख्य लेखक हैं। सानोफी और एथ ज्यूरिख में शोधकर्ताओं ने भी अनुसंधान में योगदान दिया।

मॉडलिंग हाइपरवरेबिलिटी

प्रोटीन में अमीनो एसिड की लंबी श्रृंखलाएं होती हैं, जो बड़ी संख्या में संभावित रचनाओं को मोड़ सकती हैं। हाल के वर्षों में, अल्फाफोल्ड जैसे कृत्रिम खुफिया कार्यक्रमों का उपयोग करते हुए, इन रचनाओं की भविष्यवाणी करना बहुत आसान हो गया है। इन कार्यक्रमों में से कई, जैसे कि ESMFOLDS और OMEGAFOLDS, बड़े -लैंग्वेज मॉडल डेलो पर आधारित हैं, जो बड़ी मात्रा में मूल मात्रा का विश्लेषण करने के लिए विकसित किए गए थे, जिससे उन्हें अगले शब्द की भविष्यवाणी करने के लिए सीखने की अनुमति मिलती है। यह समान दृष्टिकोण प्रोटीन अनुक्रमों के लिए काम कर सकता है – सीखना कि कौन से प्रोटीन संरचनाएं अमीनो एसिड के विभिन्न पैटर्न से बनती हैं।

हालांकि, यह तकनीक हमेशा एंटीबॉडी पर काम नहीं करती है, विशेष रूप से हाइपरवेरेबल क्षेत्र नामक एंटीबॉडी के खंड पर। एंटीबॉडी में आमतौर पर एक वाई-आकार की रचना होती है, और ये हाइपरवेरेबल क्षेत्र वाई की युक्तियों में स्थित होते हैं, जहां वे विदेशी प्रोटीन को ढूंढते और ढूंढते हैं और संयोजित करते हैं, जिसे एंटीजन के रूप में भी जाना जाता है। वाई का निचला हिस्सा संरचनात्मक समर्थन प्रदान करता है और एंटीबॉडी को प्रतिरक्षा कोशिकाओं से संपर्क करने में मदद करता है।

हाइपरवेरेबल क्षेत्र लंबाई में भिन्न होते हैं लेकिन आमतौर पर 40 से कम अमीनो एसिड होते हैं। यह अनुमान लगाया जाता है कि मानव प्रतिरक्षा इन अमीनो एसिड के क्रम को बदलकर 1 क्विंटेलियन विभिन्न एंटीबॉडी का उत्पादन कर सकती है, यह सुनिश्चित करने में मदद करती है कि शरीर संभावित एंटीजन की एक विस्तृत विविधता का जवाब दे सकता है। यह उसी तरह से विकसित नहीं किया गया है जैसे कि अनुक्रम अन्य प्रोटीन अनुक्रम हैं, इसलिए बड़े -लैंगुएज मॉडल डेलो के लिए उनकी रचनाओं की सटीक भविष्यवाणी करना सीखना मुश्किल है।

सिंह कहते हैं, “भाषा के मॉडल प्रोटीन संरचना की एक अच्छी भविष्यवाणी कर सकते हैं, इसका कारण यह है कि विकास इस अनुक्रम में इस तरह से बाधा डालता है कि मॉडल समझाएगा कि मॉडल का क्या अर्थ है।” “यह एक वाक्य में शब्दों के संदर्भ को देखकर व्याकरण के नियमों को सीखने के समान है, आपका क्या मतलब है।

उन हाइपरसेंसिटिव क्षेत्रों को मॉडल करने के लिए, शोधकर्ताओं ने दो मॉड्यूल बनाए जो मौजूदा प्रोटीन भाषा मॉडल पर निर्माण करते हैं। इनमें से एक मॉड्यूल को प्रोटीन डेटा बैंक (पीडीबी) में पाए जाने वाले लगभग 3,000 एंटीबॉडी संरचनाओं से हाइपरवेरेबल अनुक्रमों पर प्रशिक्षित किया गया था, जिससे यह सीखने की अनुमति देता है कि कौन सी अनुक्रम समान संरचनाओं का उत्पादन करता है। एक अन्य मॉड्यूल को डेटा पर प्रशिक्षित किया गया था जो लगभग 3,700 एंटीबॉडी अनुक्रमों के साथ संगत है कि वे तीन अलग -अलग एंटीजन को कैसे टाई करते हैं।

परिणामस्वरूप कम्प्यूटेशनल मॉडल, जिसे एबीएमएपी के रूप में जाना जाता है, एंटीबॉडी संरचनाओं और उनके अमीनो एसिड अनुक्रमों के आधार पर बाध्यकारी शक्ति की भविष्यवाणी कर सकता है। इस मॉडल की उपयोगिता को प्रदर्शित करने के लिए, शोधकर्ताओं ने इसका उपयोग एंटीबॉडी संरचनाओं की भविष्यवाणी करने के लिए किया जो SARS -Cove -2 वायरस के स्पाइक प्रोटीन को दृढ़ता से बेअसर कर देगा।

शोधकर्ताओं ने एंटीबॉडी के एक सेट के साथ शुरुआत की, जो इस लक्ष्य से जुड़े होने का पूर्वानुमान थे, फिर हाइपरवेरेबल क्षेत्रों को बदल दिया और लाखों चर का उत्पादन किया। उनका मॉडल एंटीबॉडी संरचनाओं की पहचान करने में सक्षम था जो बड़े भाषा मॉडल के आधार पर पारंपरिक प्रोटीन-स्केल मॉडल की तुलना में अधिक सफल, अधिक सटीक होगा।

उसके बाद, शोधकर्ताओं ने एंटीबॉडी को उन समूहों में क्लस्टर करने के लिए अतिरिक्त कदम उठाए जिनमें समान रचनाएं थीं। उन्होंने इन समूहों में से प्रत्येक से एंटीबॉडी को चुना, सनोफी शोधकर्ताओं के साथ काम करने के लिए, प्रयोगात्मक रूप से परीक्षण किया। उन प्रयोगों में पाया गया कि यह मूल एंटीबॉडी की तुलना में बेहतर बाध्यकारी शक्ति है, जो 5 प्रतिशत एंटीबॉडी में मॉडल में जा रहा है।

शोधकर्ताओं का कहना है कि विकास प्रक्रिया की शुरुआत में विभिन्न अच्छे उम्मीदवारों की पहचान करने से बाद में असफल होने वाले उम्मीदवारों के परीक्षण में बहुत पैसा खर्च करने से बचने में मदद मिल सकती है।

सिंह कहते हैं, “वे अपने सभी अंडे एक टोकरी में नहीं रखना चाहते हैं।” “वे कहना नहीं चाहते हैं, मैं इसे एक एंटीबॉडी ले जाऊंगा और इसे पूर्वकाल परीक्षण के माध्यम से ले जाऊंगा, और फिर यह विषाक्त हो जाता है। उनके पास अच्छी संभावनाओं का एक सेट होगा और उन सभी को स्थानांतरित कर देगा, ताकि अगर कोई गलत हो, तो उनके पास कुछ विकल्प हैं। “

एंटीबॉडी की तुलना

इस तकनीक का उपयोग करते हुए, शोधकर्ता कुछ लंबे सवालों के जवाब देने की कोशिश कर सकते हैं कि अलग -अलग लोग संक्रमणों के लिए अलग -अलग जवाब क्यों देते हैं। उदाहरण के लिए, कुछ लोग कोविड के अधिक गंभीर रूपों को क्यों विकसित करते हैं, और कुछ लोग जो एचआईवी के संपर्क में हैं, वे कभी संक्रमित नहीं होते हैं?

विजय एंट्स नीनो उन सवालों के जवाब देने की कोशिश कर रहा है, जो कि व्यक्तियों से प्रतिरक्षा कोशिकाओं के एकल-सेल आरएनए से उनकी तुलना कर रहा है, एंटीबॉडी रिपोर्टर विश्लेषण नामक प्रक्रिया से। पिछले काम को दिखाया गया है कि दो अलग -अलग लोगों के एंटीबॉडी संवाददाता 10 प्रतिशत के रूप में ओवरलैप कर सकते हैं। हालांकि, अनुक्रमण एक संरचनात्मक जानकारी के रूप में एंटीबॉडी प्रदर्शनी की एक व्यापक तस्वीर प्रदान नहीं करता है, क्योंकि दो एंटीबॉडी जिनमें अलग -अलग अनुक्रम होते हैं, उनमें समान संरचनाएं और कार्य हो सकते हैं।

नया मॉडल डेल एक व्यक्ति में पाए जाने वाले सभी एंटीबॉडी के लिए जल्दी से उत्पादन करके समस्या को हल करने में मदद कर सकता है। इस अध्ययन में, शोधकर्ताओं ने दिखाया कि जब संरचना को ध्यान में रखा गया था, तो व्यक्तियों के बीच आदेश की तुलना में 10 प्रतिशत से अधिक ओवरलैप किया गया था। अब वे आगे की जांच करने की योजना बना रहे हैं कि ये रचनाएँ किसी विशेष रोगज़नक़ के खिलाफ शरीर की समग्र प्रतिरक्षा प्रतिक्रिया में कैसे योगदान कर सकती हैं।

सिंह कहते हैं, “यह वह जगह है जहां भाषा मॉडल बहुत खूबसूरती से बंद है क्योंकि इसका एक अनुक्रम आधारित विश्लेषण है, लेकिन यह संरचना आधारित विश्लेषण की सटीकता से संपर्क करता है,” सिंह कहते हैं।

यह शोध स्वास्थ्य में मशीन लर्निंग के लिए सनोफी और अब्दुल लतीफ जमील क्लिनिक द्वारा वित्त पोषित किया गया था।

Scroll to Top