Google आज तक अपना ‘सबसे बुद्धिमान’ AI मॉडल पकाता है

March 27, 2025

Dr. Ashish V

Google DeepMind द्वारा आज तक मिथुन को इसके “सबसे बुद्धिमान AI मॉडल” के रूप में वर्णित किया गया है।

इस नवीनतम वेतन पीढ़ी का पहला मॉडल मिथुन 2.5 प्रो का प्रायोगिक संस्करण है, डीपमाइंड का कहना है कि बेंचमार्क की विस्तृत श्रृंखला ने परिष्कृत परिणाम प्राप्त किए हैं।

Google डीपमाइंड के सीटीओ के अनुसार, एक तरफ, मिथुन के 2.5 मॉडल “थिंकिंग मॉडल” हैं। यह प्रतिक्रिया का उत्पादन करने से पहले अपने विचारों के माध्यम से तर्क करने की उनकी क्षमता को इंगित करता है, जिससे उन्नत प्रदर्शन और सुधार सटीकता के लिए अग्रणी होता है।

“लॉजिक” की क्षमता केवल कावुकुग्लू की व्याख्या करते हुए, वर्गीकरण और भविष्यवाणी से परे है। इसमें सूचना का विश्लेषण करने, तार्किक निष्कर्षों को काटने, संदर्भ और उपद्रव को शामिल करने के लिए, और अंत में, जानकार निर्णय लेने के लिए सिस्टम की क्षमता शामिल है।

दीपमाइंड कुछ समय के लिए एआई की बुद्धिमत्ता और तर्क को बढ़ाने के तरीकों की तलाश कर रहा है, जो सुदृढीकरण शिक्षा और चेन-द-फैशन जैसी तकनीकों को नियोजित करता है। इस आधार ने मिथुन 2.0 फ्लैश थिंकिंग के नवीनतम परिचय का नेतृत्व किया, उनका पहला विचारशील मॉडल।

“अब, मिथुन 2.5 के साथ,” कावुककुग्लू कहते हैं, “हमने बेहतर पोस्ट-ट्रेन के साथ एक महत्वपूर्ण रूप से बढ़ाया बेस मॉडल को जोड़कर एक नए स्तर की प्रदर्शनी हासिल की है।”

Google इन सोच क्षमताओं को अपने भविष्य के सभी मॉडल में एकीकृत करने की योजना बना रहा है, जो उन्हें अधिक जटिल समस्याओं से निपटने और अधिक सक्षम, संदर्भ-जागरूक एजेंटों का समर्थन करने में सक्षम बनाता है।

मिथुन 2.5 प्रो अलमरेना लीडरबोर्ड शीर्ष स्थान की रक्षा करता है

जिमनी 2.5 प्रो प्रयोगात्मक जटिल कार्यों को संभालने के लिए डिपमाइंड के सबसे उन्नत मॉडल के रूप में स्थित है। लेखन के अनुसार, उन्होंने मानव विकल्पों का मूल्यांकन करने के लिए मुख्य मीट्रिक-नोट मार्जिन के एल्मेना के लीडरबोर्ड पर शीर्ष स्थान हासिल किया है, एक उच्च-गुणवत्ता वाले उच्च-सक्षम मॉडल को प्रदर्शित करता है:

Lumreena लीडरबोर्ड का स्क्रीनशॉट जहाँ Google DeepMind की नई मिथुन 2.5 प्रो प्रो प्रैक्टिकल एआई मॉडल ने अभी शीर्ष स्थान लिया है।

GEMINI 2.5 गणित, vizes, बकवास, कोडिंग और तर्क पर ‘समर्थक’ है

मिथुन 2.5 प्रो ने विभिन्न बेंचमार्क में उन्नत तर्क मांगा है।

गौरतलब है कि यह गणित और ज्ञान की ओर जाता है। परीक्षण-समय तकनीकों पर भरोसा करने के लिए बेंचमार्क-बेंचमार्क, जो कि GPQA और AIM 2025-बहुमत मतदान जैसी लागतों को बढ़ाता है। उन्होंने मानवता की अंतिम परीक्षा में 18.8% का उन्नत स्कोर भी हासिल किया, जो कि जुनवेल्टेज की मानव सीमा का मूल्यांकन करने के लिए विषय विशेषज्ञों द्वारा डिज़ाइन किया गया एक डेटासेट और लॉग किया गया।

DEEPMIND ने कोडिंग डिस्प्ले पर महत्वपूर्ण जोर दिया है, और इसके पूर्ववर्ती मिथुन 2.5 पाइपलाइन में आगे के उन्नयन के साथ, 2.0 की तुलना में महत्वपूर्ण कूद प्रस्तुत करता है। 2.5 प्रो नेत्रहीन आकर्षक वेब एप्लिकेशन और एजेंट कोड एप्लिकेशन, साथ ही कोड परिवर्तन और संपादन करने के लिए उत्कृष्ट है।

SWE-Bench सत्यापन पर, एजेंसी कोड मूल्यांकन के लिए उद्योग मानक, GEMINI 2.5 Pro ने कस्टम एजेंट सेटअप का उपयोग करके 63.8% स्कोर किया। मॉडल की तर्क क्षमताएं भी इसे एक-लाइन प्रॉम्प्ट से निष्पादन योग्य कोड उत्पन्न करके एक वीडियो गेम बनाने में सक्षम बनाती हैं।

https://www.youtube.com/watch?v=RLCBSPGOS6S

अपनी पूर्ववर्ती शक्ति पर निर्माण

मिथुन पिछले मिथुन मॉडल की मुख्य शक्तियों पर निर्माण करता है, जिसमें मूल मल्टीमोडिलिटी और एक लंबी संदर्भ विंडो शामिल है। 2.5 प्रो एक मिलियन टोकन संदर्भ विंडो के साथ लॉन्च होता है, यह जल्द ही दो मिलियन टोकन तक विस्तार करने की योजना है। यह मॉडल विस्तृत डेटासेट को विभिन्न सूचना स्रोतों, विस्तृत पाठ, ऑडियो डीओ, छवियों, वीडियो और पूरे कोड रिपॉजिटरी के साथ जटिल समस्याओं को समझने और संभालने में सक्षम बनाता है।

डेवलपर्स और एंटरप्राइजेज अब Google AI स्टूडियो में मिथुन 2.5 प्रो के साथ प्रयोग करना शुरू कर सकते हैं। मिथुन के उन्नत उपयोगकर्ताओं को डेस्क्ट .p और मोबाइल प्लेटफॉर्म पर मॉडल के ड्रॉपडाउन के माध्यम से भी करना पड़ सकता है। मॉडल को अगले सप्ताह वर्टेक्स एआई पर रोल किया जाएगा।

Google गहरे उपयोगकर्ताओं को जवाब देने के लिए प्रोत्साहित करता है, जिसका उपयोग मिथुन की क्षमताओं को और बढ़ाने के लिए किया जाएगा।

(फोटो अन्शिता नायर द्वारा)

यह भी देखें: Dippic V3-0324 पहले ओपन-सन में गैर-पुनर्जीवित AI मॉडल के लिए शीर्ष

उद्योग के नेताओं से एआई और बड़े डेटा के बारे में अधिक जानना चाहते हैं? एम्स्टर्डम, कैलिफोर्निया और लंदन में आयोजित एआई और बिग डेटा एक्सपो की जाँच करें। ब्रॉड इवेंट को इंटेलिजेंट ऑटो टोमेशन कॉन्फ्रेंस, ब्लॉकएक्स, डिजिटल ट्रांसफॉर्मेशन वीक और साइबर सिक्योरिटी एंड क्लाउड एक्सपो सहित अन्य प्रमुख घटनाओं के साथ सह-स्थित किया गया है।

TechFire द्वारा संचालित अन्य आगामी उद्यम प्रौद्योगिकी घटनाओं और वेबिनार का अन्वेषण करें।

Google आज तक अपना ‘सबसे बुद्धिमान’ AI मॉडल पकाता है

Dr. Ashish V

मिथुन 2.5 प्रो अलमरेना लीडरबोर्ड शीर्ष स्थान की रक्षा करता है

GEMINI 2.5 गणित, vizes, बकवास, कोडिंग और तर्क पर ‘समर्थक’ है

अपनी पूर्ववर्ती शक्ति पर निर्माण

You might also enjoy

Apereo Micro Conference with Anne-Marie Scott (06.04.25)

5 साल की FD पर अब मिलेगा शानदार रिटर्न! सीनियर सिटीजन को मिल रही खास छूट Bank FD Scheme

SSC Sub Inspector: एसएससी सीजीएल 14582 पदों पर भर्ती नोटिफिकेशन जारी आवेदन शुरू

Subscribe Our Newsletter

Deep See K.A.R.T. S.Pace