Google आज तक अपना ‘सबसे बुद्धिमान’ AI मॉडल पकाता है

Google DeepMind द्वारा आज तक मिथुन को इसके “सबसे बुद्धिमान AI मॉडल” के रूप में वर्णित किया गया है।

इस नवीनतम वेतन पीढ़ी का पहला मॉडल मिथुन 2.5 प्रो का प्रायोगिक संस्करण है, डीपमाइंड का कहना है कि बेंचमार्क की विस्तृत श्रृंखला ने परिष्कृत परिणाम प्राप्त किए हैं।

Google डीपमाइंड के सीटीओ के अनुसार, एक तरफ, मिथुन के 2.5 मॉडल “थिंकिंग मॉडल” हैं। यह प्रतिक्रिया का उत्पादन करने से पहले अपने विचारों के माध्यम से तर्क करने की उनकी क्षमता को इंगित करता है, जिससे उन्नत प्रदर्शन और सुधार सटीकता के लिए अग्रणी होता है।

“लॉजिक” की क्षमता केवल कावुकुग्लू की व्याख्या करते हुए, वर्गीकरण और भविष्यवाणी से परे है। इसमें सूचना का विश्लेषण करने, तार्किक निष्कर्षों को काटने, संदर्भ और उपद्रव को शामिल करने के लिए, और अंत में, जानकार निर्णय लेने के लिए सिस्टम की क्षमता शामिल है।

दीपमाइंड कुछ समय के लिए एआई की बुद्धिमत्ता और तर्क को बढ़ाने के तरीकों की तलाश कर रहा है, जो सुदृढीकरण शिक्षा और चेन-द-फैशन जैसी तकनीकों को नियोजित करता है। इस आधार ने मिथुन 2.0 फ्लैश थिंकिंग के नवीनतम परिचय का नेतृत्व किया, उनका पहला विचारशील मॉडल।

“अब, मिथुन 2.5 के साथ,” कावुककुग्लू कहते हैं, “हमने बेहतर पोस्ट-ट्रेन के साथ एक महत्वपूर्ण रूप से बढ़ाया बेस मॉडल को जोड़कर एक नए स्तर की प्रदर्शनी हासिल की है।”

Google इन सोच क्षमताओं को अपने भविष्य के सभी मॉडल में एकीकृत करने की योजना बना रहा है, जो उन्हें अधिक जटिल समस्याओं से निपटने और अधिक सक्षम, संदर्भ-जागरूक एजेंटों का समर्थन करने में सक्षम बनाता है।

मिथुन 2.5 प्रो अलमरेना लीडरबोर्ड शीर्ष स्थान की रक्षा करता है

जिमनी 2.5 प्रो प्रयोगात्मक जटिल कार्यों को संभालने के लिए डिपमाइंड के सबसे उन्नत मॉडल के रूप में स्थित है। लेखन के अनुसार, उन्होंने मानव विकल्पों का मूल्यांकन करने के लिए मुख्य मीट्रिक-नोट मार्जिन के एल्मेना के लीडरबोर्ड पर शीर्ष स्थान हासिल किया है, एक उच्च-गुणवत्ता वाले उच्च-सक्षम मॉडल को प्रदर्शित करता है:

Lumreena लीडरबोर्ड का स्क्रीनशॉट जहाँ Google DeepMind की नई मिथुन 2.5 प्रो प्रो प्रैक्टिकल एआई मॉडल ने अभी शीर्ष स्थान लिया है।

GEMINI 2.5 गणित, vizes, बकवास, कोडिंग और तर्क पर ‘समर्थक’ है

मिथुन 2.5 प्रो ने विभिन्न बेंचमार्क में उन्नत तर्क मांगा है।

गौरतलब है कि यह गणित और ज्ञान की ओर जाता है। परीक्षण-समय तकनीकों पर भरोसा करने के लिए बेंचमार्क-बेंचमार्क, जो कि GPQA और AIM 2025-बहुमत मतदान जैसी लागतों को बढ़ाता है। उन्होंने मानवता की अंतिम परीक्षा में 18.8% का उन्नत स्कोर भी हासिल किया, जो कि जुनवेल्टेज की मानव सीमा का मूल्यांकन करने के लिए विषय विशेषज्ञों द्वारा डिज़ाइन किया गया एक डेटासेट और लॉग किया गया।

DEEPMIND ने कोडिंग डिस्प्ले पर महत्वपूर्ण जोर दिया है, और इसके पूर्ववर्ती मिथुन 2.5 पाइपलाइन में आगे के उन्नयन के साथ, 2.0 की तुलना में महत्वपूर्ण कूद प्रस्तुत करता है। 2.5 प्रो नेत्रहीन आकर्षक वेब एप्लिकेशन और एजेंट कोड एप्लिकेशन, साथ ही कोड परिवर्तन और संपादन करने के लिए उत्कृष्ट है।

SWE-Bench सत्यापन पर, एजेंसी कोड मूल्यांकन के लिए उद्योग मानक, GEMINI 2.5 Pro ने कस्टम एजेंट सेटअप का उपयोग करके 63.8% स्कोर किया। मॉडल की तर्क क्षमताएं भी इसे एक-लाइन प्रॉम्प्ट से निष्पादन योग्य कोड उत्पन्न करके एक वीडियो गेम बनाने में सक्षम बनाती हैं।

https://www.youtube.com/watch?v=RLCBSPGOS6S

अपनी पूर्ववर्ती शक्ति पर निर्माण

मिथुन पिछले मिथुन मॉडल की मुख्य शक्तियों पर निर्माण करता है, जिसमें मूल मल्टीमोडिलिटी और एक लंबी संदर्भ विंडो शामिल है। 2.5 प्रो एक मिलियन टोकन संदर्भ विंडो के साथ लॉन्च होता है, यह जल्द ही दो मिलियन टोकन तक विस्तार करने की योजना है। यह मॉडल विस्तृत डेटासेट को विभिन्न सूचना स्रोतों, विस्तृत पाठ, ऑडियो डीओ, छवियों, वीडियो और पूरे कोड रिपॉजिटरी के साथ जटिल समस्याओं को समझने और संभालने में सक्षम बनाता है।

डेवलपर्स और एंटरप्राइजेज अब Google AI स्टूडियो में मिथुन 2.5 प्रो के साथ प्रयोग करना शुरू कर सकते हैं। मिथुन के उन्नत उपयोगकर्ताओं को डेस्क्ट .p और मोबाइल प्लेटफॉर्म पर मॉडल के ड्रॉपडाउन के माध्यम से भी करना पड़ सकता है। मॉडल को अगले सप्ताह वर्टेक्स एआई पर रोल किया जाएगा।

Google गहरे उपयोगकर्ताओं को जवाब देने के लिए प्रोत्साहित करता है, जिसका उपयोग मिथुन की क्षमताओं को और बढ़ाने के लिए किया जाएगा।

(फोटो अन्शिता नायर द्वारा)

यह भी देखें: Dippic V3-0324 पहले ओपन-सन में गैर-पुनर्जीवित AI मॉडल के लिए शीर्ष

उद्योग के नेताओं से एआई और बड़े डेटा के बारे में अधिक जानना चाहते हैं? एम्स्टर्डम, कैलिफोर्निया और लंदन में आयोजित एआई और बिग डेटा एक्सपो की जाँच करें। ब्रॉड इवेंट को इंटेलिजेंट ऑटो टोमेशन कॉन्फ्रेंस, ब्लॉकएक्स, डिजिटल ट्रांसफॉर्मेशन वीक और साइबर सिक्योरिटी एंड क्लाउड एक्सपो सहित अन्य प्रमुख घटनाओं के साथ सह-स्थित किया गया है।

TechFire द्वारा संचालित अन्य आगामी उद्यम प्रौद्योगिकी घटनाओं और वेबिनार का अन्वेषण करें।

Scroll to Top