आपके शरीर में प्रत्येक सेल में समान आनुवंशिक अनुक्रम होता है, फिर भी प्रत्येक सेल उन जीनों का केवल एक सबसेट व्यक्त करता है। ये सेल-विशिष्ट जीन अभिव्यक्ति पैटर्न, जो यह सुनिश्चित करता है कि मस्तिष्क कोशिका त्वचा की कोशिका से अलग है, आंशिक रूप से IE आनुवंशिक सामग्री की तीन-आयामी संरचना द्वारा निर्धारित की जाती है, जो प्रत्येक जीन की ibility को नियंत्रित करती है।
एमआईटी केमिस्ट अब आर्टिफिशियल इंटेलिजेंस उत्पन्न करते हुए, 3 डी जीनोम संरचनाओं का निर्धारण करने के एक नए तरीके के साथ आए हैं। उनकी तकनीक कुछ ही मिनटों में हजारों प्रारूपों की भविष्यवाणी कर सकती है, जिससे रचनाओं का विश्लेषण करने के लिए मौजूदा प्रयोगात्मक तरीकों की तुलना में तेजी से तेजी से बढ़ी।
इस तकनीक का उपयोग करते हुए, शोधकर्ता आसानी से अध्ययन कर सकते हैं कि जीनोम का 3 डी संगठन जीन अभिव्यक्ति पैटर्न और व्यक्तिगत कोशिकाओं के कार्यों को कैसे प्रभावित करता है।
एक सहयोगी प्रोफेसर और अध्ययन के वरिष्ठ लेखक बिन झांग कहते हैं, “हमारा लक्ष्य डीएनए अनुक्रमों से त्रि-आयामी जीनोम संरचना की भविष्यवाणी करने की कोशिश करना था।” “अब हम इसे कर सकते हैं, जो कि अत्याधुनिक प्रयोगात्मक तकनीकों की तुलना में इस तकनीक को डालता है, वास्तव में कई दिलचस्प अवसर खोल सकता है।”
एमआईटी ग्रैडू विजय विज्ञान की प्रगति।
द्वारा -ऑर्डर संरचना
सेल न्यूक्लियस के भीतर, डीएनए और प्रोटीन एक कॉम्प्लेक्स बनाते हैं जिसे क्रोमैटीन कहा जाता है, जो संगठन की कई परतों के साथ होता है, जो कोशिकाओं को नाभिक में 2 मीटर डीएनए को क्रैम करने की अनुमति देता है, जो केवल एक सौ व्यास है। प्रोटीन के चारों ओर डीएनए हवा के लंबे स्ट्रैंड्स, हिस्टोन्स कहा जाता है, जो एक स्ट्रिंग पर एक घोंसले के शिकार की संरचना को जन्म देते हैं।
एपिजेनेटिक परिवर्तनों के रूप में जानी जाने वाली रासायनिक टीएस गैसों को कुछ स्थानों पर डीएनए के साथ जोड़ा जा सकता है, और ये टीएस, जो सेल प्रकार से भिन्न होते हैं, क्रोमैटीन की तह और आस -पास के जीन की पहुंच को प्रभावित करते हैं। क्रोमैटाइन पुष्टिकरण में ये अंतर यह निर्धारित करने में मदद करते हैं कि कौन से जीन अलग -अलग सेल प्रकारों में या किसी दिए गए सेल के भीतर अलग -अलग समय पर व्यक्त किए जाते हैं।
पिछले 20 वर्षों में, विजय ने क्रोमैटिन संरचनाओं को निर्धारित करने के लिए प्रयोगात्मक तकनीकें विकसित की हैं। एक व्यापक रूप से उपयोग की जाने वाली तकनीक, जिसे हाय-सी के रूप में जाना जाता है, सेल के नाभिक में पड़ोसी डीएनए स्ट्रैंड्स को मिलाकर काम करता है। शोधकर्ता तब यह निर्धारित कर सकते हैं कि डीएनए को कई छोटे टुकड़ों में काटकर और उन्हें अनुक्रम देकर कौन से सेगमेंट एक -दूसरे के करीब स्थित हैं।
इस विधि का उपयोग कोशिकाओं की एक बड़ी आबादी पर किया जा सकता है ताकि किसी विशेष सेल की रचनाओं को निर्धारित करने के लिए औसत रचना को क्रोमैटीन के खंड के लिए, या एक कोशिका पर गणना की जाए। हालांकि, हाय-सी और इसी तरह की तकनीक श्रम-गहन हैं, और एक सेल से डेटा का उत्पादन करने में लगभग एक सप्ताह लग सकता है।
उन सीमाओं को दूर करने के लिए, झांग और उनके छात्रों ने एक मॉडल विकसित किया जो एक कोशिका में क्रोमैटिन संरचनाओं की भविष्यवाणी करने का एक त्वरित, सटीक तरीका बनाने के लिए जेनेरिक एआई में हाल की प्रगति का लाभ उठाता है। एआई मॉडल जो वे डिज़ाइन करते हैं, वे जल्दी से डीएनए अनुक्रमों का विश्लेषण कर सकते हैं और क्रोमैटीन संरचनाओं की भविष्यवाणी कर सकते हैं जो अनुक्रम सेल में उत्पादन कर सकते हैं।
झांग कहते हैं, “पैटर्न के विश्वास में डीप लर्निंग वास्तव में अच्छा है।” “यह हमें बहुत लंबे डीएनए खंडों, हजारों बेस जोड़े का विश्लेषण करने की अनुमति देता है, और यह आंकड़ा है कि डीएनए बेस जोड़ी में महत्वपूर्ण जानकारी क्या है।”
क्रोमोजेन के शोधकर्ताओं द्वारा बनाए गए मॉडल में दो घटक हैं। पहला घटक, शिक्षण जीनोम “पढ़ा” डीप वैंड एजुकेशन मॉडल, अंतर्निहित डीएनए अनुक्रम और क्रोमैटिन परिग्रहण कामुकता डेटा में एन्कोड की गई जानकारी का विश्लेषण करता है, जो बाद में व्यापक रूप से उपलब्ध है और सेल प्रकार-विशिष्ट है।
एक अन्य घटक एक उत्पन्न करने वाला एआई मॉडल है जिसे 11 मिलियन से अधिक क्रोमैटीन पुष्टि पर प्रशिक्षित किया गया है, शारीरिक रूप से सटीक क्रोमैटिन पुष्टि की भविष्यवाणी करता है। यह डेटा मानव बी लिम्फोसाइटों की लाइन से 16 कोशिकाओं पर डीआईपी-सी (एक प्रकार का हाय-सी) का उपयोग करके प्रयोगों द्वारा निर्मित किया गया था।
जब एकीकृत किया जाता है, तो पहला घटक जेनेरिक मॉडल को सूचित करता है कि कैसे एक सेल प्रकार-विशिष्ट वातावरण विभिन्न क्रोमैटिन संरचनाओं के गठन को प्रभावित करता है, और यह योजना प्रभावी रूप से अनुक्रम-संरचनाओं को पकड़ती है। प्रत्येक आदेश के लिए, शोधकर्ता कई संभावित डिजाइन बनाने के लिए अपने मॉडल का उपयोग करते हैं। ऐसा इसलिए है क्योंकि डीएनए एक बहुत ही गन्दा अणु है, इसलिए एक एकल डीएनए ऑर्डर कई संभावित रचनाओं को जन्म दे सकता है।
“एक जीनोम के गठन की भविष्यवाणी करने के लिए प्रमुख जटिल कारकों में से एक यह है कि हमारा लक्ष्य नहीं है। प्रारूपों का वितरण है, चाहे आप जिस जीनोम को देख रहे हों, उसका कोई फर्क नहीं पड़ता। यह अनुमान लगाने के लिए कि एक बहुत ही जटिल, उच्च-आयामी संख्यात्मक वितरण कुछ ऐसा है जो करने के लिए बेहद चुनौतीपूर्ण है, “शूट कहते हैं।
त्वरित विश्लेषण
एक बार प्रशिक्षित होने के बाद, मॉडल HI-C या अन्य प्रयोगात्मक तकनीकों की तुलना में तेज समय पर भविष्यवाणियों का उत्पादन कर सकता है।
“जब आप किसी दिए गए सेल प्रकार में कुछ दर्जन संरचनाओं को प्राप्त करने के लिए छह -महीने के प्रयोग से गुजर सकते हैं, तो आप केवल एक विशेष क्षेत्र में एक हजार संरचनाओं का उत्पादन कर सकते हैं जो हमारे मॉडल के साथ 20 मिनट में एक जीपीयू पर है,” शूट कहते हैं।
अपने मॉडल को प्रशिक्षित करने के बाद, शोधकर्ताओं ने 2,000 से अधिक डीएनए अनुक्रमों के लिए संरचना की भविष्यवाणियों का उत्पादन करने के लिए इसका उपयोग किया, फिर उनकी तुलना अनुक्रमों के लिए व्यावहारिक रचनाओं के साथ की। उन्होंने पाया कि मॉडल द्वारा उत्पादित रचनाएँ प्रयोगात्मक डेटा के समान या बहुत समान थीं।
झांग कहते हैं, “हम आमतौर पर प्रत्येक आदेश के लिए सैकड़ों या हजारों रचनाओं को चाहते हैं, और यह आपको किसी विशेष क्षेत्र की विभिन्न प्रकार की रचनाओं का एक उचित प्रतिनिधित्व देता है।” “यदि आप अपने प्रयोग को कई बार दोहराते हैं, तो विभिन्न कोशिकाओं में, आप एक बहुत अलग रचना के साथ समाप्त हो जाएंगे। हमारा मॉडल भविष्यवाणी करने की कोशिश कर रहा है। “
शोधकर्ताओं ने यह भी पाया कि मॉडल प्रशिक्षित को छोड़कर, सेल प्रकारों से डेटा के लिए सटीक भविष्यवाणियां कर सकता है। इससे पता चलता है कि मॉडल यह विश्लेषण करने के लिए उपयोगी हो सकता है कि कोशिकाओं के प्रकारों के बीच क्रोमैटीन संरचनाएं कैसे भिन्न होती हैं, और वे अंतर उनके कार्य को कैसे प्रभावित करते हैं। मॉडल का उपयोग विभिन्न क्रोमैटिन राज्यों का पता लगाने के लिए भी किया जा सकता है जो एक ही कोशिका में मौजूद हो सकते हैं, और यह जीन अभिव्यक्ति को कैसे प्रभावित करता है।
“क्रोमोजेन जीनोम फोल्डिंग सिद्धांतों के एआई-चालित निष्कर्षों के लिए एक नई संरचना प्रदान करता है और दिखाता है कि जेनेरिक एआई 3 डी जीनोम संरचना के साथ जीनोमिक और एपिलैक्टेड विशेषताओं को खींच सकता है, जीनोम संरचनाओं की विविधता और जैविक की एक विस्तृत श्रृंखला में कार्यों की ओर इशारा करता है।” कार्नेगी का कहना है कि मेलन विश्वविद्यालय विश्वविद्यालय में एक प्रोफेसर जियान मा, जो अनुसंधान में शामिल नहीं थे।
एक अन्य संभावित अनुप्रयोग यह है कि किसी विशेष डीएनए अनुक्रम में एक परिवर्तन यह पता लगाना है कि क्रोमैटीन कैसे पुष्टि को बदल सकता है, जो इस तरह के बदलाव से बीमारी का कारण बन सकता है।
“कई दिलचस्प सवाल हैं जो मुझे लगता है कि हम इस प्रकार के मॉडल के साथ संबोधित कर सकते हैं,” झांग कहते हैं।
शोधकर्ताओं ने इसे अन्य लोगों के लिए उपलब्ध कराया है जो अपने सभी डेटा और मॉडल का उपयोग करना चाहते हैं।
अनुसंधान राष्ट्रीय स्वास्थ्य संस्थानों द्वारा वित्त पोषित किया गया था।