आर्क पुरस्कार ने अपना सबसे कठिन एआई बेंचमार्क लॉन्च किया: आर्क -एजी -2

March 25, 2025

Dr. Ashish V

आर्क पुरस्कार ने एक हार्डकोर आर्क -एजी -2 बेंचमार्क लॉन्च किया है, जिसमें 2025 की प्रतियोगिता की घोषणा $ 1 मिलियन के पुरस्कार के साथ की गई है।

उदाहरण के लिए, एआई संकीर्ण कार्यों को करके सामान्य, अनुकूली बुद्धिमत्ता प्रदर्शित करने के लिए आगे बढ़ता है, आर्क -एजी -2 चुनौतियों का उद्देश्य क्षमता की दूरी को उजागर करना और सक्रिय रूप से नवाचार का मार्गदर्शन करना है।

आर्क पुरस्कार टीम कहती हैं, “गुड एजीआई बेंचमार्क उपयोगी प्रगति संकेतक के रूप में कार्य करते हैं। अधिक एजीआई बेंचमार्क स्पष्ट रूप से मान्यता प्राप्त क्षमताएं हैं। सबसे अच्छा एजीआई बेंचमार्क यह सब करता है और सक्रिय रूप से अनुसंधान और गाइड को प्रेरित करता है,” आर्क पुरस्कार टीम कहती है।

ARC -AGI -2 “सर्वश्रेष्ठ” श्रेणी को प्राप्त करने के लिए तैयार हो रहा है।

मेमोरियल से परे

जब से इसे 2019 में स्थापित किया गया था, एआरसी पुरस्कार ने एक बेंचमार्क बनाकर एजीआई की यात्रा करने वाले शोधकर्ताओं के लिए “नॉर्थ स्टार” के रूप में कार्य किया है।

ARC -Agi -1 जैसे बेंचमार्क तरल बुद्धि को मापने के लिए झुके (अर्थात, नए अदृश्य कार्यों में सीखने की क्षमता।) यह डेटासेट से एक स्पष्ट प्रस्थान का प्रतिनिधित्व करता है जो अकेले यादों को पुरस्कृत करता है।

एआरसी पुरस्कार का मिशन भी अद्वितीय सफलता के लिए समयरेखा को तेज करने का लक्ष्य रखता है। इसके बेंचमार्क न केवल प्रगति को मापने के लिए बल्कि नए विचारों को प्रेरित करने के लिए डिज़ाइन किए गए हैं।

शोधकर्ताओं ने 2024 के अंत में ओपन ओ 3 की शुरुआत के साथ महत्वपूर्ण पारियों का अवलोकन किया, जो आर्क -एजी -1 का उपयोग करके मूल्यांकन करता है। गहरी सीखने-आधारित बड़े-आधारित बड़े-बड़े भाषा के मॉडल (एलएलएम) को लॉजिक सिंथेसिस इंजन के साथ जोड़कर, ओ 3 ने एक प्रगति को चिह्नित किया, जहां एआई रोट यादगार के बाहर पारगमन था।

फिर भी, प्रगति के बावजूद, O3 जैसी प्रणालियां अक्षम रहती हैं और प्रशिक्षण प्रक्रियाओं के दौरान महत्वपूर्ण मानव निगरानी की आवश्यकता होती है। सच्ची अनुकूलनशीलता और दक्षता के लिए इन प्रणालियों को चुनौती देने के लिए, आर्क पुरस्कार ARC -AGI -2 का प्रतिनिधित्व करता है।

आर्क-एजीआई -2: एक मानव-मशीन गैप को बंद करना

ARC -AGI -2 बेंचमार्क AI के लिए कठिन है, फिर भी मनुष्यों के लिए अपने परिग्रहण को बरकरार रखता है। जबकि फ्रंटियर एआई लॉजिक सिस्टम एआरसी-एजीआई -2 पर एकल-अंक प्रतिशत में स्कोर करना जारी रखता है, मनुष्य दो प्रयासों के तहत हर कार्य को हल कर सकता है।

तो, आर्क-एगी क्या सेट करता है? इसका डिजाइन दर्शन ऐसे कार्यों को चुनता है जो एआई के लिए मनुष्यों के लिए अपेक्षाकृत सरल, अभी तक कठिन या असंभव हैं। “

बेंचमार्क में अलग -अलग दृश्यता और निम्नलिखित विशेषताओं के साथ डेटासेट शामिल हैं:

प्रतीकात्मक व्याख्या: एआई प्रतीकों को सार्थक महत्व देने के लिए संघर्ष करता है, इसके बजाय उथले तुलना पर ध्यान केंद्रित करता है, जैसे कि सममित सत्यापन।
रचनात्मक तर्क: जब इसे एक साथ कई बातचीत के नियमों को लागू करने की आवश्यकता होती है, तो ए.आई.
संदर्भ नियम आवेदन: सिस्टम जटिल संदर्भों के आधार पर नियमों को अलग-अलग तरीके से लागू करने में विफल रहते हैं, अक्सर सतह-स्तरीय पैटर्न पर फिक्सिंग करते हैं।

अधिकांश मौजूदा बेंचमार्क अधिकांश व्यक्तियों के लिए दुर्गम पैमाने पर उन्नत, विशेष कौशल का परीक्षण करने के लिए, हाइपरसेंसिटिव क्षमताओं पर ध्यान केंद्रित करते हैं।

आर्क-एजी स्क्रिप्ट को फ्लिप करता है और प्रकाशित करता है कि एआई अभी तक क्या नहीं कर सकता है; विशेष रूप से अनुकूलनशीलता जो मानव बुद्धिमत्ता को परिभाषित करती है। जबकि उन कार्यों के बीच की दूरी जो मनुष्यों के लिए आसान है, लेकिन एआई के लिए मुश्किल अंततः शून्य तक पहुंच जाती है, एजीआई को प्राप्त किया जा सकता है।

हालांकि, एजीआई प्राप्त करना कार्यों को हल करने की क्षमता तक सीमित नहीं है; दक्षता – समाधान खोजने के लिए आवश्यक लागत और संसाधन – एक महत्वपूर्ण परिभाषित कारक के रूप में उभरना।

दक्षता की भूमिका

खुफिया जानकारी का अनुमान लगाने के लिए प्रति कार्य लागत के माध्यम से प्रभाव को मापना आवश्यक है, न केवल समस्या को हल करने की क्षमता बल्कि प्रभावी रूप से।

वास्तविक दुनिया के उदाहरण पहले से ही मनुष्यों और फ्रंटियर एआई सिस्टम के बीच दक्षता अंतराल दिखा रहे हैं:

मानव पैनल दक्षता: आरएएस काम पर 100% सटीकता के साथ आर्क -एजी -2 कार्य पास करता है।
Openi o 3: प्रारंभिक अनुमानों से संकेत मिलता है कि 200 डी $ प्रति कार्य पर 4% सफलता की दर।

यह मैट्रिक्स मनुष्यों और एआई के बीच अनुकूलनशीलता और संसाधन की खपत में असमानता को रेखांकित करता है। एआरसी पुरस्कार भविष्य के लीडबोर्ड स्कोर के साथ दक्षता की रिपोर्टिंग के लिए प्रतिबद्ध है।

दक्षता पर ध्यान केंद्रित करना क्रूर-बल समाधानों के लिए “सच्ची खुफिया” माना जाता है।

एआरसी पुरस्कार के अनुसार, ज्ञान में न्यूनतम संसाधनों के साथ समाधान शामिल हैं – एक गुणवत्ता स्पष्ट रूप से मानवीय है लेकिन अभी भी एआई के लिए मायावी है।

आर्क प्राइज 2025

आर्क प्राइज 2025 इस सप्ताह कागल में लॉन्च हुआ, कुल पुरस्कारों में मिलियन 1 मिलियन का वादा करता है, और ओपन सोर्स प्रगति के लिए लाइव लीडरबोर्ड प्रदर्शित करता है। प्रतियोगिता का उद्देश्य उन प्रणालियों के लिए प्रगति करना है जो प्रभावी रूप से आर्क -गि -2 चुनौतियों के साथ सामना कर सकते हैं।

पुरस्कार श्रेणी में, जो 2024 के औसत से अधिक है, यानी:

सुरुचिपूर्ण पुरस्कार: Kagal दक्षता की सीमा के भीतर 85% सफलता तक पहुंचने के लिए, 000 700,000।
शीर्ष स्कोर पुरस्कार: उच्चतम स्कोरिंग सबमिशन के लिए, 000 75,000।
पेपर पुरस्कार: परिवर्तनकारी विचारों के लिए जो एआरसी-एजीआई कार्यों को हल करने में योगदान करते हैं, 000 50,000।
अतिरिक्त पुरस्कार: 5 175,000, प्रतियोगिता के दौरान बाकी विवरणों के साथ।

ये प्रोत्साहन शोधकर्ताओं, प्रयोगशालाओं और स्वतंत्र टीमों में सहयोग को बढ़ावा देते समय निष्पक्ष और सार्थक प्रगति सुनिश्चित करते हैं।

https://www.youtube.com/watch?v=Z6CTTKVQAYG

पिछले साल, आर्क प्राइज 2024 में 1,500 प्रतिद्वंद्वी टीमों को देखा गया था, जिसके परिणामस्वरूप सराहनीय उद्योग प्रभाव के 40 कागजात थे। लक्ष्य इस वर्ष की अधिक सफलता का पोषण करना है।

एआरसी पुरस्कार का मानना है कि मौजूदा सिस्टम को स्केल करने के बजाय उपन्यास के विचारों पर प्रगति होती है। कुशल सामान्य प्रणालियों में प्रगति वर्तमान तकनीकी दिग्गजों से उत्पन्न नहीं हो सकती है, लेकिन बोल्ड, रचनात्मक शोधकर्ताओं से जटिलता और विदेशी प्रयोगों को स्वीकार करती है।

(छवि क्रेडिट: आर्क पुरस्कार)

यह भी देखें: Dippic V3-0324 पहले ओपन-सन में गैर-पुनर्जीवित AI मॉडल के लिए शीर्ष

उद्योग के नेताओं से एआई और बड़े डेटा के बारे में अधिक जानना चाहते हैं? एम्स्टर्डम, कैलिफोर्निया और लंदन में आयोजित एआई और बिग डेटा एक्सपो की जाँच करें। ब्रॉड इवेंट को इंटेलिजेंट ऑटो टोमेशन कॉन्फ्रेंस, ब्लॉकएक्स, डिजिटल ट्रांसफॉर्मेशन वीक और साइबर सिक्योरिटी एंड क्लाउड एक्सपो सहित अन्य प्रमुख घटनाओं के साथ सह-स्थित किया गया है।

TechFire द्वारा संचालित अन्य आगामी उद्यम प्रौद्योगिकी घटनाओं और वेबिनार का अन्वेषण करें।

आर्क पुरस्कार ने अपना सबसे कठिन एआई बेंचमार्क लॉन्च किया: आर्क -एजी -2

Dr. Ashish V

मेमोरियल से परे

आर्क-एजीआई -2: एक मानव-मशीन गैप को बंद करना

दक्षता की भूमिका

आर्क प्राइज 2025

You might also enjoy

Skip M3 Ultra & RTX 5090 for LLMs | NEW 96GB KING

Apple Pal Image Generest Technol G. All L-E और Midjarnie के साथ मुख्य AI एडवांस के साथ

OpenAI планирует улучшить личность CHATGPT

Subscribe Our Newsletter

Deep See K.A.R.T. S.Pace