Google ने 128K संदर्भ विंडो के साथ सोर्स जेम्मा 3 मॉडल ओपन का अनावरण किया

March 12, 2025

Dr. Ashish V

नवीनतम अपडेट और प्रमुख एआई कवरेज पर विशिष्ट सामग्री के लिए हमारे दैनिक और साप्ताहिक समाचार पत्र में शामिल हों। और अधिक जानें

यद्यपि बड़ी भाषा और तर्क मॉडल लोकप्रिय हैं, संगठन कम ऊर्जा क्षेत्रों और लागत चिंताओं के साथ एआई प्रक्रियाओं को चलाने के लिए छोटे मॉडल की ओर रुख करते हैं।

जबकि कुछ संगठन छोटे संस्करणों में सबसे बड़े मॉडल को निराश कर रहे हैं, Google जैसे मॉडल प्रदाता बड़े -लैंगुएज मॉडल डेल्ट्स (एलएलएम) के विकल्प के रूप में छोटे -लैंगुएज मॉडल डेल्ट्स (एसएलएम) को उजागर करते हैं, जो निष्पादित करने या निष्पादित करने के लिए अधिक खर्च कर सकते हैं।

इस बात को ध्यान में रखते हुए, Google ने अपना छोटा मॉडल, जेम्मा का नवीनतम संस्करण जारी किया है, जिसमें विस्तृत संदर्भ विंडो, बड़े आयाम और अधिक मल्टीमॉडल लॉजिक क्षमताएं शामिल हैं।

GEMMA 3, जिसमें बड़े मिथुन 2.0 मॉडल के समान समान प्रसंस्करण शक्ति है, का उपयोग फोन और लैपटॉप जैसे छोटे उपकरणों द्वारा किया जाता है। नए मॉडल के चार आकार हैं: 1 बी, 4 बी, 12 बी और 27 बी आयाम।

इसके विपरीत, जेम्मा 2 में एक 80k संदर्भ विंडो थी – जेम्मा 3 अधिक जानकारी और जटिल अनुरोधों को समझ सकती थी – 128k टोकन की एक बड़ी संदर्भ विंडो के साथ। Google ने 140 भाषाओं में काम करने के लिए GEMA 3 को अपडेट किया, छवियों, पाठ और लघु वीडियो का विश्लेषण किया, और समर्थन फ़ंक्शन को कॉल करने के लिए फ़ंक्शंस और एजेंट वर्कफ़्लोज़ को स्वचालित किया।

जेम्मा मजबूत प्रदर्शन प्रदान करता है

कंप्यूटिंग लागत को और कम करने के लिए, Google ने GEMMA का परिमाणित संस्करण पेश किया है। संपीड़ित मॉडल के रूप में परिमाणित मॉडल के बारे में सोचें। यह सटीकता का त्याग किए बिना “मॉडल के वजन में सांख्यिकीय मूल्यों की सटीकता को कम करने” की प्रक्रिया के माध्यम से है।

Google ने कहा कि जेम्मा 3 “अपने आकार के लिए परिष्कृत प्रदर्शन प्रदान करता है” और लालमा -405 बी, डीप्सिक-वी 3 और ओ 3-माइन जैसे प्रमुख एलएलएम का नेतृत्व करता है। GEMMA 3 27B, विशेष रूप से, चैटबोट एरिना एलो स्कोर परीक्षणों में दीपस्क-आर 1 के बाद दूसरे स्थान पर आया। यह छोटे मॉडल डेल, दीप्सिक वी 3, ओपनई की ओ 3 -मिनी, मेटाना लालमा -405 बी और मिस्टल लार्ज में रैंक करता है।

GEMMA 3 को निर्धारित करके, उपयोगकर्ता प्रदर्शन में सुधार कर सकते हैं, मॉडल चला सकते हैं, और एप्लिकेशन बना सकते हैं “जो एक GPU और टेंडर्स प्रोसेसिंग यूनिट (TPU) को होस्ट पर फिट कर सकते हैं।”

GEMMA 3 डेवलपर टूल जैसे फेस ट्रांसफॉर्मर, ओलामा, जैक, केरस, पियच और अन्य जैसे डेवलपर टूल के साथ एकीकृत है। उपयोगकर्ताओं के पास एक Google AI स्टूडियो भी हो सकता है, गले लगाया, आमने -सामने या कागल द्वारा। कंपनियां और डेवलपर्स एआई स्टूडियो के माध्यम से जेम्मा 3 एपीआई के उम्मीद के मामले का अनुरोध कर सकते हैं।

सुरक्षा के लिए ज्वेल

Google ने कहा कि उसने Gemma 3 में एक सुरक्षा प्रोटोकॉल बनाया था, जिसमें Shiledgamma 2 नामक छवियों के लिए एक सुरक्षा चेकर शामिल है।

Google एक ब्लॉग पोस्ट में लिखते हैं, “जेम्मा 3 के विकास में विस्तारित डेटा गवर्नेंस, फाइन-ट्यूनिंग और मजबूत बेंचमार्क मूल्यांकन के माध्यम से हमारी सुरक्षा नीतियों के साथ कॉन्फ़िगरेशन शामिल है।” “जब अधिक सक्षम मॉडल की गहन परीक्षण डेलो अक्सर कम सक्षम लोगों के हमारे आकलन की रिपोर्ट करता है, तो जेम्मा 3 के उन्नत एसटीएम। प्रदर्शनी को हानिकारक पदार्थ बनाने के लिए अपने दुरुपयोग की क्षमता पर केंद्रित विशिष्ट मूल्यांकन के बारे में पूछा जाता है; उनके परिणाम कम जोखिम के स्तर का संकेत देते हैं। “

Shiledgamma 2 एक 4B आयाम छवि सुरक्षा चेकर है जो 3 फाउंडेशन पर बनाया गया है। यह मॉडल को यौन स्पष्ट सामग्री, हिंसा और अन्य खतरनाक भौतिक छवियों पर प्रतिक्रिया करने से रोकता है। उपयोगकर्ता अपनी विशिष्ट आवश्यकताओं के अनुरूप Shieldgemma 2 को अनुकूलित कर सकते हैं।

छोटे मॉडल पर आसवन और वृद्धि

चूंकि Google ने 2024 में पहली बार GEMMA पेश किया था, SLMA ने ब्याज में वृद्धि देखी है। अन्य छोटे मॉडल जैसे Micros .FFT के PHI -4 और मिस्टी स्मॉल 3 का सुझाव है कि एंटरप्राइज़ LLMs जैसे शक्तिशाली मॉडल के साथ एक एप्लिकेशन बनाना चाहता है, लेकिन एलएलएम की पूरी चौड़ाई का उपयोग करना आवश्यक नहीं है।

उद्योग ने आसवन द्वारा चयनित एलएलएम के छोटे संस्करणों की ओर भी मुड़ना शुरू कर दिया है। स्पष्ट होने के लिए, मिथुन 2.0 को डिस्टिल नहीं करता है; इसके बजाय, यह एक ही डेटासेट और वास्तुकला के साथ प्रशिक्षित है। डिस्टिल्ड मॉडल डेल एक बड़े मॉडल के साथ सीखता है, जो जेम्मा नहीं करता है।

संगठन अक्सर एक मॉडल में कुछ उपयोग के मामलों को फिट करना पसंद करते हैं। O3-Mini या क्लाउड 7.7 Sonnet जैसे LLM को तैनात करने के बजाय, एक साधारण कोड संपादक, एक छोटा मॉडल, चाहे SLM या एक डिस्टिल्ड संस्करण, एक बड़े मॉडल को ओवरलोड किए बिना आसानी से उन कार्यों को कर सकता है।

वीबी दैनिक के साथ पेशेवर उपयोग के मामलों पर दैनिक अंतर्दृष्टि

यदि आप अपने बॉस को प्रभावित करना चाहते हैं, तो वीबी ने आपको हर दिन कवर किया है। हम आपको एक अंदर के स्कूप देते हैं कि विनियामक शिफ्ट से लेकर प्रैक्टिकल परिनियोजन तक की कंपनियां एआई उत्पन्न करने के साथ क्या कर रही हैं, इसलिए आप अधिकतम आरओआई के लिए अंतर्दृष्टि साझा कर सकते हैं।

हमारी गोपनीयता नीति पढ़ें

सदस्यता के लिए धन्यवाद। यहां और अधिक वीबी न्यूज़लेटर्स देखें।

एक त्रुटि पाई गई।

Google ने 128K संदर्भ विंडो के साथ सोर्स जेम्मा 3 मॉडल ओपन का अनावरण किया

Dr. Ashish V

जेम्मा मजबूत प्रदर्शन प्रदान करता है

सुरक्षा के लिए ज्वेल

छोटे मॉडल पर आसवन और वृद्धि

You might also enjoy

Vivo Y19 5G – Shandar look in just Rs.5,999

Oppo Reno 13 Pro 5G – 50megapixel camera with more features

बेटा हो या बेटी! पिता की प्रॉपर्टी में कौन कितना हकदार? जानिए नया कानून क्या कहता है Property Rights

Subscribe Our Newsletter

Deep See K.A.R.T. S.Pace