अल्फेटेन्सर के साथ उपन्यास एल्गोरिदम की खोज

अनुसंधान

प्रबुद्ध
लेखक

अलहुसिन फवाज़ी, मटेज बालोग, बर्नार्डिनो रोमेरा-पैरेड्स, डेमिस हसबिस, पुशमित कोहली

गणित में अल्फाज़ेरो का पहला विस्तार अनुसंधान अनुसंधान के लिए नई संभावनाओं को अनल्वेस करता है

एल्गोरिदम ने गणितज्ञों को हजारों वर्षों तक बुनियादी काम करने में मदद की है। प्राचीन मिस्रियों ने एक गुणन तालिका की आवश्यकता के बिना दो संख्याओं को गुणा करने के लिए एक एल्गोरिथ्म बनाया, और ग्रीक गणितज्ञ यूक्लाइड ने सबसे बड़े सामान्य डिवाइडर की गणना करने के लिए एक एल्गोरिथ्म का वर्णन किया, जो आज भी उपयोग में है।

इस्लामिक गोल्ड एज के दौरान, फारसी गणितज्ञ मुहम्मद इबान मूसा अल-खावरिज़्मी ने रैखिक और चतुर्भुज समीकरणों को हल करने के लिए नए एल्गोरिदम बनाया। वास्तव में, अल-खावरीज़मी का नाम, जैसा कि लैटिन में अनुवादित किया गया है अल्कोहलिटोमीशब्द एल्गोरिथ्म के लिए अग्रणी। लेकिन, आज एल्गोरिदम के साथ परिचित होने के बावजूद – कक्षा अल्गॉर्फोलॉजी से लेकर किनारों तक का उपयोग किया जाता है।

हमारे पेपर में, आज नेचर में प्रकाशित, हम उपस्थित है जासूसउपन्यास, कुशल और मैट्रिक्स गुणा जैसे बुनियादी कार्यों के लिए सही एल्गोरिदम का पता लगाने के लिए पहली कृत्रिम बुद्धिमत्ता (एआई) प्रणाली। इन दोनों मैट्रिस को गुणा करने का सबसे तेज़ तरीका ढूंढना गणित में गणित में एक खुले प्रश्न पर प्रकाश डालेगा।

यह पेपर विजय एडवांस और एआई का उपयोग करके सबसे बुनियादी समस्याओं को आगे बढ़ाने के लिए डिपमाइंड मिशन में एक कदम है। हमारी प्रणाली, अल्फाबेटर्स पर, अल्फाज़ेरो, एक एजेंट, जिसने शतरंज, गो और शोगी जैसे बोर्ड गेम पर एक उच्च प्रदर्शन दिखाया है, और यह कार्य पहली बार अवांछित गणितीय समस्याओं के लिए अल्फाज़ेरो गेम खेलने से एक यात्रा दिखाता है।

गुणा किया हुआ मैट्रिक्स

मैट्रिक्स गुणा बीजगणित में एक सरल ऑपरेशन है, जिसे आमतौर पर हाई स्कूल मैथ्स की कक्षाओं में पढ़ाया जाता है। लेकिन कक्षा के बाहर, इस कोमल गणितीय ऑपरेशन का समकालीन डिजिटल दुनिया में बहुत प्रभाव है और आधुनिक कंप्यूटिंग में सर्वव्यापी है।

दो 3×3 मैट्रिस को गुणा करने की प्रक्रिया का उदाहरण।

इस ऑपरेशन पेरिएशन के उपयोग का उपयोग स्मार्टफोन पर छवियों को संसाधित करने, भाषण कमांड को पहचानने, कंप्यूटर गेम के लिए ग्राफिक्स का उत्पादन करने, मौसम की भविष्यवाणी करने के लिए सिमुलेशन चलाने, डेटा और वीडियो को इंटरनेट पर साझा करने के लिए डेटा और वीडियो को संपीड़ित करने के लिए किया जाता है। दुनिया भर की कंपनियां प्रभावी रूप से मैट्रिसेस को गुणा करने के लिए कंप्यूटिंग हार्डवेयर विकसित करने के लिए बहुत समय और पैसा खर्च करती हैं। इसलिए, यहां तक ​​कि मैट्रिक्स गुणा की दक्षता में सबसे छोटे सुधार का व्यापक प्रभाव हो सकता है।

सदियों से, गणितज्ञों का मानना ​​था कि दक्षता के मामले में मानक मैट्रिक्स गुणा एल्गोरिथ्म सबसे अच्छा हो सकता है। लेकिन 1969 में, जर्मन गणितज्ञ वोल्कर तनाव ने गणितीय समुदाय को चौंका दिया कि बेहतर एल्गोरिदम मौजूद थे।

मानक एल्गोरिथ्म, जो तनावपूर्ण एल्गोरिथ्म की तुलना में 2×2 मैट्रिस को गुणा करने के लिए एक कम स्केलर गुणन (7 के बजाय 7) का उपयोग करता है। गुणन समग्र दक्षता के परिवर्धन से अधिक महत्वपूर्ण है।

बहुत छोटे मैट्रिसेस (आकार 2×2) के एक अध्ययन के माध्यम से, वह एक त्वरित एल्गोरिथ्म प्राप्त करने के लिए मैट्रिस की प्रविष्टियों को जोड़ने के लिए एक बुद्धिमान तरीका ढूंढता है। तनावपूर्ण प्रगति के बाद दशकों के शोध के बावजूद, इस समस्या के बड़े संस्करण अनसुलझे हैं – इस हद तक कि दो मैट्रिक्स को गुणा करना संभव नहीं है जो 3×3 के रूप में छोटे हैं।

हमारे पेपर में, हमें पता चला कि कैसे आधुनिक एआई तकनीक नए मैट्रिक्स गुणा एल्गोरिदम के स्वचालित आविष्कार को स्थानांतरित कर सकती है। मानव आंतरिक iction की प्रगति को ध्यान में रखते हुए, अल्फेटेन्सर एल्गोरिदम को ढूंढते हैं। जो कई मैट्रिक्स आकारों के लिए कला की स्थिति से अधिक कुशल है। हमारे एआई-डिज़ाइन किए गए एल्गोरिदम मानव-डिज़ाइन किए गए लोगों को जन्म देते हैं, जो एल्गोरिथम खोज के क्षेत्र में एक प्रमुख कदम है।

स्वचालित एल्गोरिथम आविष्कार की प्रक्रिया और प्रगति

सबसे पहले, हम मैट्रिक्स गुणन के लिए कुशल एल्गोरिदम खोजने की समस्या को एकल-प्लेड गेम में परिवर्तित करते हैं। इस खेल में, बोर्ड एक तीन-आयामी टेंसर (संख्याओं की एक सरणी) है, जो वर्तमान एल्गोरिथ्म पर उपयुक्त है। एल्गोरिथ्म के निर्देशों के अनुरूप वैध चालों के सेट से, खिलाड़ी टेंसर को बेहतर बनाने और अपनी प्रविष्टियों को शून्य करने की कोशिश करता है। जब खिलाड़ी ऐसा करने का प्रबंधन करता है, तो इसका परिणाम किसी भी मैट्रिस के लिए एक उचित मैट्रिक्स गुणा एल्गोरिथ्म होता है, और इसकी दक्षता शून्य पर उठाए गए कदमों की संख्या से कैप्चर की जाती है।

खेल बेहद चुनौतीपूर्ण है – यहां तक ​​कि मैट्रिक्स गुणा के छोटे मामलों के लिए, विचार करने के लिए संभावित एल्गोरिदम की संख्या ब्रह्मांड में परमाणुओं की संख्या से बहुत अधिक है। खेल की तुलना में, जो दशकों से एआई के लिए एक चुनौती है, हमारे खेल के प्रत्येक चरण पर संभावित चालों की संख्या तीव्रता के 30 आदेश है (सेटिंग्स से 1033 से ऊपर)।

अनिवार्य रूप से, इस खेल को अच्छी तरह से खेलने के लिए, एक व्यक्ति को संभावनाओं के एक बड़े घास में सबसे छोटी सुई की पहचान करने की आवश्यकता होती है। इस डोमेन की चुनौतियों का सामना करने के लिए, जो पारंपरिक खेलों से काफी प्रस्थान करता है, हमने कई महत्वपूर्ण तत्वों को विकसित किया है, जिसमें एक उपन्यास तंत्रिका नेटवर्क वास्तुकला शामिल है, जिसमें एक समस्या-विशिष्ट प्रेरक पूर्वाग्रह, उपयोगी सिंथेटिक डेटा और सममित लाभ के लिए एक नुस्खा शामिल है। ।

हमने तब खेल को खेलने के लिए सुदृढीकरण का उपयोग करके वर्णमाला एजेंट को प्रशिक्षित किया, मौजूदा मैट्रिक्स गुणा एल्गोरिदम के बारे में कोई Jnowledge के साथ शुरू किया। शिक्षा के द्वारा, वर्णमाला धीरे -धीरे समय के साथ सुधार करती है, स्ट्रेसेन की तरह एक ऐतिहासिक कॉमिक, जो तेजी से मैट्रिक्स द्वारा गुणा किए गए एल्गोरिदम को फिर से डिज़ाइन करता है, अंततः मानव सेवन के क्षेत्र को पार कर जाता है और पहले से ज्ञात की तुलना में तेजी से।

एकल-खिलाड़ी गेम वर्णमाला द्वारा खेला जाता है, जहां लक्ष्य उपयुक्त मैट्रिक्स गुणा एल्गोरिथ्म को ढूंढना है। खेल की स्थिति संख्याओं का एक क्यूबिक सरणी है (0 के लिए ग्रे के रूप में दिखाया गया है, 1 के लिए नीला और -1 के लिए हरे रंग), जो बाकी फ़ंक्शन का प्रतिनिधित्व करता है।

उदाहरण के लिए, यदि स्कूल में पढ़ाया जाने वाला पारंपरिक एल्गोरिथ्म 100 गुणन का उपयोग करके 4×5 को 5×5 मेट्रिक्स से गुणा करता है, और यह संख्या मानव सरलता के साथ 80 तक कम हो गई थी, तो अल्फेटेन्सर को एल्गोरिदम मिला है जो केवल 76 गुणन के समान उपयोग करते हैं।

AL 76 गुणन का उपयोग करके अल्फेटेन्सर द्वारा पता लगाया गया एल्गोरिथ्म, परिष्कृत एल्गोरिदम से अधिक सुधार।

इस उदाहरण के अलावा, एल्गोरिथ्म का एल्गोरिथ्म 50 साल पहले अपनी खोज के बाद पहली बार एक सीमित क्षेत्र में दो-स्तरीय एल्गोरिथ्म पर सुधार करता है। छोटे मैट्रिस को गुणा करने के लिए इन एल्गोरिदम का उपयोग मनमाना आकारों को गुणा करने के लिए आदिम के रूप में किया जा सकता है।

इसके अलावा, Alphatensar प्रत्येक आकार के लिए हजारों मैट्रिक्स के हजारों मैट्रिक्स गुणा एल्गोरिदम के साथ विभिन्न प्रकार के एल्गोरिदम भी पाता है, जो दर्शाता है कि मैट्रिक्स गुणा एल्गोरिदम का स्थान पिछले विचार की तुलना में समृद्ध है।

इस समृद्ध स्थान के एल्गोरिदम में विभिन्न गणितीय और व्यावहारिक गुण हैं। इस किस्म को लाभ, हम अल्फेटेन्सर को विशेष रूप से एल्गोरिदम खोजने के लिए स्वीकार करते हैं जो किसी दिए गए हार्डवेयर पर तेजी से होता है, जैसे कि NVIDIA V100 GPU, और Google TPU V2। जो मनमाने ढंग से उद्देश्यों के लिए वर्णमाला राहत का प्रदर्शन करते हैं।

रनटाइम के अनुरूप एल्गोरिथ्म के उद्देश्य के साथ अल्फेटेन्सर। जब उपयुक्त मैट्रिक्स गुणा एल्गोरिथ्म पाया जाता है, तो लक्ष्य हार्डवेयर पर अधिक कुशल एल्गोरिदम सीखने के लिए, यह लक्ष्य हार्डवेयर पर बेंचमार्क किया जाता है, जिसे बाद में ALF में वापस आ जाता है।

भविष्य के अनुसंधान और अनुप्रयोगों पर प्रभाव की खोज

गणितीय दृष्टिकोण से, हमारे परिणाम जटिलता के सिद्धांत में अधिक शोध का मार्गदर्शन कर सकते हैं, जिसका उद्देश्य गणना समस्याओं को हल करने के लिए सबसे तेज गणितीय नियमों को निर्धारित करना है। पिछले दृष्टिकोणों की तुलना में अधिक प्रभावी रूप से संभावित एल्गोरिदम के स्थान की खोज करके, अल्फाबेटार मैट्रिक्स कई एल्गोरिदम की समृद्धि की हमारी समझ को आगे बढ़ाने में मदद करता है। इस स्थान को समझने से मैट्रिक्स गुणा की स्पर्शोन्मुख जटिलता को निर्धारित करने के लिए नए परिणाम हो सकते हैं, जो कंप्यूटर विजिल की सबसे बुनियादी खुली समस्याओं में से एक है।

मैट्रिक्स गुणा के कारण कई कम्प्यूटेशनल कार्यों का मुख्य घटक है, कंप्यूटर ग्राफिक्स स्प्रेड, डिजिटल संचार, तंत्रिका नेटवर्क प्रशिक्षण और संलग्नक। किसी भी प्रकार के उद्देश्य पर विचार करने के लिए वर्णमाला राहत भी एल्गोरिदम के गठन के लिए नए अनुप्रयोगों को उत्तेजित कर सकती है जो कि इष्टतम ज़ोएल की खपत और संख्यात्मक स्थिरता जैसे मैट्रिक्स को पछतावा करते हैं, स्नोबॉलिंग से छोटी गोलाकार त्रुटियों को रोकने में मदद करते हैं।

जबकि हमने यहां मैट्रिक्स गुणा की विशिष्ट समस्या पर ध्यान केंद्रित किया है, हम आशा करते हैं कि हमारा पेपर दूसरों को अन्य बुनियादी गणना कार्यों के लिए एल्गोरिथम खोज का मार्गदर्शन करने के लिए एआई का उपयोग करने के लिए प्रेरित करेगा। हमारे शोध से यह भी पता चलता है कि अल्फाज़ेरो एक शक्तिशाली एल्गोरिथ्म है जिसे गणित में खुली समस्याओं को हल करने में मदद करने के लिए पारंपरिक खेलों के डोमेन से बढ़ाया जा सकता है। हमारे शोध के मद्देनजर, हम अधिकांश काम – गणित और ज्ञान को प्रोत्साहित करने की उम्मीद करते हैं। समाज में कुछ सबसे महत्वपूर्ण चुनौतियों को हल करने के लिए एआई का उपयोग।

आप अल्फाटेन्सर के GitHub रिपॉजिटरी में अधिक जानकारी पा सकते हैं।

पावती

फ्रांसिस्को आर। रुइस, थॉमस ह्यूबर्ट, अलेक्जेंडर नोविकोव, एलेक्स जी एयू एयू नट के लिए एक ब्लॉग पोस्ट का जवाब देने के लिए। सीन कार्लसन, एरियल बीयर, गैब्रिएला पर्ल, केटी मी ए काटकानी, टेक्स्ट के लिए मैक्स बार्नेट और उनकी मदद के लिए आरेख। यह काम अलहसिन फावज़ी, मतेज बालोग, आजा हुआंग, थॉमस ह्यूबर्ट, बर्नार्डिनो रोमेरा-पर्स, मोहम्मदामिन बेयरकटैन, फ्रांसिस्को रुइज़, अलेक्जेंडर नोविकोव के योगदानकर्ताओं के साथ एक टीम थी।

Scroll to Top