रोगों के कारण को निर्देशित करने के लिए आनुवंशिक उत्परिवर्तन की सूची

अनुसंधान

प्रबुद्ध
लेखक

Iga थे और जून चेंग

नया एआई टूल 71 मिलियन ‘गलतफहमी’ परिवर्तनों के प्रभावों को वर्गीकृत करता है

बीमारी के मूल कारण को उजागर करना मानव आनुवंशिकी में सबसे बड़ी चुनौती है। लाखों संभावित परिवर्तन और सीमित प्रयोगात्मक डेटा के साथ, यह अभी भी एक रहस्य है जो बीमारी का कारण बन सकता है। यह एक त्वरित निदान और जीवन -संबंधी उपचार विकसित करने के लिए महत्वपूर्ण है।

आज, हम ‘गलतफहमी’ परिवर्तनों की एक सूची को मुक्त कर रहे हैं, जहां शोधकर्ताओं के बारे में अधिक जान सकते हैं कि उनका प्रभाव क्या हो सकता है। गलतफहमी एक आनुवंशिक परिवर्तन है जो मानव प्रोटीन के कार्य को प्रभावित कर सकता है। कुछ मामलों में, वे सिस्टिक फाइब्रोसिस, सिकल-सेल एनीमिया या कैंसर जैसी बीमारियों को जन्म दे सकते हैं।

अल्फैमिसेंस कैटलॉग को अल्फामिसेंस का उपयोग करके विकसित किया गया था, जो हमारा नया एआई मॉडल है जो गलत तरीके से वर्गीकृत चर है। विजयन में प्रकाशित एक पेपर में, हम दिखाते हैं कि 71 मिलियन संभावित गलतफहमी चर में से 89% संभावित रोगजनक या संभावित कोमल के रूप में वर्गीकृत करते हैं। इसके विपरीत, मानव विशेषज्ञों द्वारा केवल 0.1% की पुष्टि की गई है।

एआई उपकरण जो सटीक रूप से भविष्यवाणी कर सकते हैं, परमाणु जीवों से लेकर नैदानिक ​​और संख्यात्मक आनुवंशिकी तक के क्षेत्रों में अनुसंधान में तेजी लाने की शक्ति है। एक बीमारी पैदा करने वाले परिवर्तन को उजागर करने के लिए प्रयोग महंगे हैं और कठिन-पूर्व प्रोटीन अद्वितीय है और प्रत्येक प्रयोग को अलग से डिज़ाइन करना होगा जिसे महीनों लग सकते हैं। एआई भविष्यवाणियों का उपयोग करते हुए, शोधकर्ता एक बार हजारों प्रोटीनों के परिणामों का पूर्वावलोकन कर सकते हैं, जो संसाधनों को प्राथमिकता देने और अधिक जटिल अध्ययनों में तेजी लाने में मदद कर सकते हैं।

हमने एक पेशेवर और शोधकर्ता के उपयोग के लिए अपनी सभी भविष्यवाणियों को स्वतंत्र रूप से उपलब्ध कराया है, और अल्फैमिसेंस के लिए मॉडल कोड खोला है।

अल्फैमिसेंस ने सभी संभव 71 मिलियन गलतफहमी चर की रोगजनकता की भविष्यवाणी की। उन्होंने 89% को वर्गीकृत किया – 57% संभावित रूप से सौम्य और 32% संभावित रोगज़नक़ का पूर्वानुमान।

एक गलतफहमी संस्करण क्या है?

एक गलतफहमी संस्करण डीएनए में एक पत्र विकल्प है जिसके परिणामस्वरूप प्रोटीन के भीतर एक अलग अमीनो एसिड होता है। यदि आप डीएनए के बारे में एक भाषा के रूप में सोचते हैं, तो एक पत्र की जगह एक शब्द बदल सकती है और वाक्य के अर्थ को एक साथ बदल सकती है। इस मामले में, प्रतिस्थापन में एक बदलाव है कि अमीनो एसिड का अनुवाद किया जाता है, जो प्रोटीन के कार्य को प्रभावित कर सकता है।

औसत व्यक्ति के पास 9,000 से अधिक गलतफहमी चर हैं। अधिकांश सौम्य हैं और इसका कोई प्रभाव नहीं है, लेकिन अन्य रोगजनक हैं और प्रोटीन फ़ंक्शन को गंभीरता से बाधित कर सकते हैं। दुर्लभ आनुवंशिक रोगों के निदान में गलतफहमी वेरिएंट का उपयोग किया जा सकता है, जहां कुछ या एक भी गलतफहमी प्रत्यक्ष बीमारी का कारण बन सकती है। टाइप 2 डायबिटीज जैसे जटिल बीमारियों का अध्ययन करना भी महत्वपूर्ण है, जो कई अलग -अलग प्रकार के आनुवंशिक परिवर्तनों के संयोजन के कारण हो सकता है।

गलतफहमी चर का वर्गीकरण यह समझने के लिए एक महत्वपूर्ण कदम है कि यह प्रोटीन बीमारी को उत्तेजित कर सकता है। मनुष्यों में पहले से देखे गए 4 मिलियन से अधिक गलतफहमी चर में से, केवल 2% ओटी को विशेषज्ञों द्वारा रोगजनक या कोमल के रूप में नोट किया गया है, लगभग 71 मिलियन संभावित गलत धारणा चर का लगभग 0.1%। बाकी को उनके प्रभाव पर प्रयोगात्मक या नैदानिक ​​डेटा की कमी के कारण ‘अज्ञात महत्वपूर्ण प्रकार’ माना जाता है। अब हमारे पास 89% चर को वर्गीकृत करके 89% चर का उपयोग करके सबसे स्पष्ट तस्वीर है जो कि अल्फैमिसेंस के साथ हैं जो ज्ञात रोग प्रकारों के डेटाबेस पर 90% सटीकता प्राप्त करते हैं।

रोगजनक या सौम्य: Alphamisens चर को कैसे वर्गीकृत करता है

अल्फैमिसेंस हमारे ब्रेकथ्रू मॉडल अल्फाफोल्ड पर आधारित है, जो उनके अमीनो एसिड अनुक्रमों के लिए जाने जाने वाले लगभग सभी प्रोटीनों के लिए रचनाओं की भविष्यवाणी करता है। हमारा सुविधाजनक मॉडल गलतफहमी के रोगजनन की भविष्यवाणी कर सकता है जो प्रोटीन के व्यक्तिगत अमीनो एसिड को बदल देता है।

अल्फैमिसेंस को प्रशिक्षित करने के लिए, हमने मानव और निकट से संबंधित प्रमुख आबादी में पाए जाने वाले लेबल को अलग करने वाले लेबल पर अल्फफोल्ड को बारीक रूप से ट्यून किया। आमतौर पर देखे जाने वाले चर को एक कोमल के रूप में माना जाता है, और अप्रत्याशित प्रकारों को रोगजनक माना जाता है। अल्पाभिणी प्रोटीन की स्थिरता पर परिवर्तन या अन्य प्रभावों पर प्रोटीन प्रारूप में परिवर्तन की भविष्यवाणी नहीं करती है। इसके बजाय, यह प्रासंगिक प्रोटीन अनुक्रमों के डेटाबेस का लाभ देता है और 0 और 1 के बीच एक स्कोर का उत्पादन करने के लिए एक प्रकार के संरचनात्मक संदर्भ में रोगजनक होने की संभावना को रेटिंग देता है। निरंतर स्कोर उपयोगकर्ताओं को रोगजनक या कोमल के रूप में वर्गीकृत करने के लिए एक सीमा का चयन करने की अनुमति देता है जो उनकी सटीकता आवश्यकताओं से मेल खाते हैं।

कैसे अल्फैमिसेंस मानव गलतफहमी चर को वर्गीकृत करता है। एक गलतफहमी संस्करण इनपुट है, और एआई सिस्टम इसे एक रोगजनक या संभावित कोमल के रूप में स्कोर करता है। अल्फैमिसेंस प्रोटीन भाषा के संरचनात्मक संदर्भ और मॉडलिंग को जोड़ती है, और यह मानव और प्रेट वेरिएंट जनसंख्या आवृत्ति डेटाबेस पर बहुत अच्छा है।

अल्फैमिसेंस इस तरह के सभी डेटा पर स्पष्ट प्रशिक्षण के बिना, आनुवंशिक और प्रयोगात्मक बेंचमार्क की एक विस्तृत श्रृंखला में उन्नत भविष्यवाणियां प्राप्त करता है। हमारे उपकरण अन्य गणना विधियों को छोड़ देते हैं, जब मानव प्रकार और बीमारी के बीच संबंधों पर डेटा का एक सार्वजनिक संग्रह, एक क्लीनवर से चर को वर्गीकृत करने के लिए उपयोग किया जाता है। हमारा मॉडल प्रयोगशाला से परिणामों की भविष्यवाणी करने के लिए सबसे सटीक विधि भी था, जो दर्शाता है कि यह रोगजनकों को मापने के विभिन्न तरीकों के अनुरूप है।

अल्फैमिसेंस ने गलतफहमी चर प्रभावों के पूर्वानुमान पर अन्य गणना विधियों को आगे बढ़ाया।
बाएं: क्लिनवर पब्लिक आर्काइव से वर्गीकरण के प्रकारों पर अल्पैसेंस और अन्य तरीकों की प्रदर्शनी की तुलना। ग्रे में दिखाए गए तरीकों को सीधे क्लिवर पर प्रशिक्षित किया गया था और इस बेंचमार्क पर उनका प्रदर्शन अत्यधिक उच्च होने की संभावना है क्योंकि उनके कुछ प्रशिक्षण प्रकार इस परीक्षण सेट में निहित हैं।
सही: जैविक प्रयोगों से माप की भविष्यवाणी करने पर अल्पैसेंस और अन्य तरीकों के प्रभाव की तुलना करें।

सामुदायिक संसाधन

अल्फैमिसेंस प्रोटीन की दुनिया की समझ को आगे बढ़ाने के लिए अल्फफोल्ड बनाता है। एक साल पहले, हमने अल्फाफोल्ड का उपयोग करके 200 मिलियन प्रोटीन संरचनाओं को पेश किया -जो दुनिया भर के लाखों दुश्मनों की मदद कर रहा है। हम यह देखने के लिए उत्सुक हैं कि कैसे अल्फामिसेंस जीनोमिक्स के दिल में और जैविक संबंधों में खुले प्रश्नों को हल करने में मदद कर सकते हैं।

हमने वाणिज्यिक और दुश्मन दोनों के लिए स्वतंत्र रूप से उपलब्ध अल्फैमिसेंस पूर्वानुमानों को बनाया है। EMBL-AB के साथ, हम उन्हें कलाकारों की टुकड़ी के प्रभाव के भविष्यवक्ता द्वारा और भी अधिक उपयोगी बना रहे हैं।

हमारी लुक-अप टेबल मिस एफ मिसेंस चेंज के अलावा, हमने 19,000 से अधिक मानव प्रोटीनों पर सभी संभावित 216 मिलियन एकल अमीनो एसिड अनुक्रमों की विस्तारित भविष्यवाणियों को साझा किया। हमने प्रत्येक जीन के लिए एक औसत पूर्वानुमान भी शामिल किया है, जो जीन के विकासवादी बाधा को मापने के समान है – यह इंगित करता है कि जीव के अस्तित्व के लिए जीन कितना महत्वपूर्ण है।

अल्फफोल्ड पर ओवरले अल्फैमिसेंस भविष्यवाणियों के उदाहरणों की भविष्यवाणी की गई रचनाओं (लाल = रोगजनक के रूप में भविष्यवाणी की गई, नीले = कोमल, ग्रे = अनिश्चित के रूप में भविष्यवाणी की गई)। रेड डॉट्स अच्छी तरह से ज्ञात रोगजनक मिज़ेन्स वेरिएंट का प्रतिनिधित्व करते हैं, ब्लू डॉट्स क्लीनवर डेटाबेस से ज्ञात कोमल चर का प्रतिनिधित्व करते हैं।
बाएं: एचबीबी प्रोटीन। इस प्रोटीन में चर सिकल सेल एनीमिया का कारण बन सकते हैं।
सही: CFTR प्रोटीन। इस प्रोटीन में चर सिस्टिक फाइब्रोसिस का कारण बन सकते हैं।

आनुवंशिक रोगों में अनुसंधान वेग

इस शोध का अनुवाद करने का मुख्य कदम विजय के साथ सहयोग करना है। हम जीनोमिक्स इंग्लैंड की साझेदारी में काम कर रहे हैं, यह पता लगाने के लिए कि ये भविष्यवाणियां दुर्लभ रोगों के आनुवंशिकी का अध्ययन कैसे कर सकती हैं। जीनोमिक्स इंग्लैंड क्रॉस-रेफर किए गए अल्फामिसेंस के निष्कर्ष पहले मानव प्रतिभागियों के साथ एकत्र किए गए वेरिएंट रोगजनक डेटा के साथ हैं। उनके मूल्यांकन ने पुष्टि की कि हमारी भविष्यवाणियां सटीक और सुसंगत हैं, अल्फैमिसेंस के लिए अन्य वास्तविक दुनिया के बेंचमार्क की पेशकश करते हैं।

जबकि हमारी भविष्यवाणियों को सीधे क्लिनिक में उपयोग करने के लिए डिज़ाइन नहीं किया गया है और साक्ष्य के अन्य स्रोतों के साथ व्याख्या की गई है-कार्य दुर्लभ आनुवंशिक विकारों के निदान में सुधार करने की संभावना है, और नए रोग पैदा करने वाले जीनों का पता लगाने में मदद करता है।

अंततः, हम आशा करते हैं कि अन्य उपकरणों के साथ अल्पैसेंस, शोधकर्ताओं को बीमारियों को बेहतर ढंग से समझने और नए जीवन बचाव उपचारों को विकसित करने की अनुमति देगा।

अल्फैमिसेंस के बारे में अधिक जानें:

नोट

*अल्फामिसेंस के पूर्वानुमान 13 मार्च 2024 के तहत उपलब्ध हैं V.4 द्वारा cc लाइसेंस, पिछले गैर-वाणिज्यिक उपयोग प्रतिबंध है। कृपया देखें प्रकाशित डेटाबेस और ज़ेनाडो अधिक प्रवेश जानकारी के लिए।

हम पाठ और आरेखों के लिए उनकी मदद के लिए जुआनिता बवागन, जेस वाल्डेज़, केटी मी ए कटकनी, कैथरीन सिगार, होली डॉबसन को धन्यवाद देना चाहते हैं। हम अपने बाहरी भागीदारों, जीनोमिक्स इंग्लैंड और ईएमबीएल-ईबी के लिए उनके निरंतर समर्थन के लिए भी आभारी हैं। इस कार्य को सह-लेखकों के योगदान के लिए जिम्मेदार ठहराया गया था: गुइडो नोवती, जोशुआ पैन, क्लेयर बायक्रॉफ्ट, एक्विल, एमगुलिटी, टेलर ऐप्पल पल्स उम, अलेक्जेंडर प्रिट्ज़ेल, ला होंग वोंग, मिशेल ज़िलिंस्की, तोबियास। सीनियर, जॉन जम्पर, डेमिस हसबिस, पुशमित कोहली। हम कैथरीन तुनसुवुनाकुल, रॉब फर्गस, एलिसो पापा, डेविड ला, जेकरी वू, सारा-जेन डन, काइल आर। टेलर, नताशा लतीशेवा, हामिश टॉमलिंसन, ऑगस्टिन ofídek, रोज प्याज, मीरा लूट, मौली, मौली, बेक, एनेट ओबिका, हन्नाह ग्लेडमैन, फालके अबू, एलिस पियर्स, जेम्स टैम, क्यू ग्रीन, मिरा फॉर टीम फॉर उनके समर्थन, सहायता और प्रतिक्रिया।

Scroll to Top