Google ने 128K संदर्भ विंडो के साथ सोर्स जेम्मा 3 मॉडल ओपन का अनावरण किया


नवीनतम अपडेट और प्रमुख एआई कवरेज पर विशिष्ट सामग्री के लिए हमारे दैनिक और साप्ताहिक समाचार पत्र में शामिल हों। और अधिक जानें


यद्यपि बड़ी भाषा और तर्क मॉडल लोकप्रिय हैं, संगठन कम ऊर्जा क्षेत्रों और लागत चिंताओं के साथ एआई प्रक्रियाओं को चलाने के लिए छोटे मॉडल की ओर रुख करते हैं।

जबकि कुछ संगठन छोटे संस्करणों में सबसे बड़े मॉडल को निराश कर रहे हैं, Google जैसे मॉडल प्रदाता बड़े -लैंगुएज मॉडल डेल्ट्स (एलएलएम) के विकल्प के रूप में छोटे -लैंगुएज मॉडल डेल्ट्स (एसएलएम) को उजागर करते हैं, जो निष्पादित करने या निष्पादित करने के लिए अधिक खर्च कर सकते हैं।

इस बात को ध्यान में रखते हुए, Google ने अपना छोटा मॉडल, जेम्मा का नवीनतम संस्करण जारी किया है, जिसमें विस्तृत संदर्भ विंडो, बड़े आयाम और अधिक मल्टीमॉडल लॉजिक क्षमताएं शामिल हैं।

GEMMA 3, जिसमें बड़े मिथुन 2.0 मॉडल के समान समान प्रसंस्करण शक्ति है, का उपयोग फोन और लैपटॉप जैसे छोटे उपकरणों द्वारा किया जाता है। नए मॉडल के चार आकार हैं: 1 बी, 4 बी, 12 बी और 27 बी आयाम।

इसके विपरीत, जेम्मा 2 में एक 80k संदर्भ विंडो थी – जेम्मा 3 अधिक जानकारी और जटिल अनुरोधों को समझ सकती थी – 128k टोकन की एक बड़ी संदर्भ विंडो के साथ। Google ने 140 भाषाओं में काम करने के लिए GEMA 3 को अपडेट किया, छवियों, पाठ और लघु वीडियो का विश्लेषण किया, और समर्थन फ़ंक्शन को कॉल करने के लिए फ़ंक्शंस और एजेंट वर्कफ़्लोज़ को स्वचालित किया।

जेम्मा मजबूत प्रदर्शन प्रदान करता है

कंप्यूटिंग लागत को और कम करने के लिए, Google ने GEMMA का परिमाणित संस्करण पेश किया है। संपीड़ित मॉडल के रूप में परिमाणित मॉडल के बारे में सोचें। यह सटीकता का त्याग किए बिना “मॉडल के वजन में सांख्यिकीय मूल्यों की सटीकता को कम करने” की प्रक्रिया के माध्यम से है।

Google ने कहा कि जेम्मा 3 “अपने आकार के लिए परिष्कृत प्रदर्शन प्रदान करता है” और लालमा -405 बी, डीप्सिक-वी 3 और ओ 3-माइन जैसे प्रमुख एलएलएम का नेतृत्व करता है। GEMMA 3 27B, विशेष रूप से, चैटबोट एरिना एलो स्कोर परीक्षणों में दीपस्क-आर 1 के बाद दूसरे स्थान पर आया। यह छोटे मॉडल डेल, दीप्सिक वी 3, ओपनई की ओ 3 -मिनी, मेटाना लालमा -405 बी और मिस्टल लार्ज में रैंक करता है।

GEMMA 3 को निर्धारित करके, उपयोगकर्ता प्रदर्शन में सुधार कर सकते हैं, मॉडल चला सकते हैं, और एप्लिकेशन बना सकते हैं “जो एक GPU और टेंडर्स प्रोसेसिंग यूनिट (TPU) को होस्ट पर फिट कर सकते हैं।”

GEMMA 3 डेवलपर टूल जैसे फेस ट्रांसफॉर्मर, ओलामा, जैक, केरस, पियच और अन्य जैसे डेवलपर टूल के साथ एकीकृत है। उपयोगकर्ताओं के पास एक Google AI स्टूडियो भी हो सकता है, गले लगाया, आमने -सामने या कागल द्वारा। कंपनियां और डेवलपर्स एआई स्टूडियो के माध्यम से जेम्मा 3 एपीआई के उम्मीद के मामले का अनुरोध कर सकते हैं।

सुरक्षा के लिए ज्वेल

Google ने कहा कि उसने Gemma 3 में एक सुरक्षा प्रोटोकॉल बनाया था, जिसमें Shiledgamma 2 नामक छवियों के लिए एक सुरक्षा चेकर शामिल है।

Google एक ब्लॉग पोस्ट में लिखते हैं, “जेम्मा 3 के विकास में विस्तारित डेटा गवर्नेंस, फाइन-ट्यूनिंग और मजबूत बेंचमार्क मूल्यांकन के माध्यम से हमारी सुरक्षा नीतियों के साथ कॉन्फ़िगरेशन शामिल है।” “जब अधिक सक्षम मॉडल की गहन परीक्षण डेलो अक्सर कम सक्षम लोगों के हमारे आकलन की रिपोर्ट करता है, तो जेम्मा 3 के उन्नत एसटीएम। प्रदर्शनी को हानिकारक पदार्थ बनाने के लिए अपने दुरुपयोग की क्षमता पर केंद्रित विशिष्ट मूल्यांकन के बारे में पूछा जाता है; उनके परिणाम कम जोखिम के स्तर का संकेत देते हैं। “

Shiledgamma 2 एक 4B आयाम छवि सुरक्षा चेकर है जो 3 फाउंडेशन पर बनाया गया है। यह मॉडल को यौन स्पष्ट सामग्री, हिंसा और अन्य खतरनाक भौतिक छवियों पर प्रतिक्रिया करने से रोकता है। उपयोगकर्ता अपनी विशिष्ट आवश्यकताओं के अनुरूप Shieldgemma 2 को अनुकूलित कर सकते हैं।

छोटे मॉडल पर आसवन और वृद्धि

चूंकि Google ने 2024 में पहली बार GEMMA पेश किया था, SLMA ने ब्याज में वृद्धि देखी है। अन्य छोटे मॉडल जैसे Micros .FFT के PHI -4 और मिस्टी स्मॉल 3 का सुझाव है कि एंटरप्राइज़ LLMs जैसे शक्तिशाली मॉडल के साथ एक एप्लिकेशन बनाना चाहता है, लेकिन एलएलएम की पूरी चौड़ाई का उपयोग करना आवश्यक नहीं है।

उद्योग ने आसवन द्वारा चयनित एलएलएम के छोटे संस्करणों की ओर भी मुड़ना शुरू कर दिया है। स्पष्ट होने के लिए, मिथुन 2.0 को डिस्टिल नहीं करता है; इसके बजाय, यह एक ही डेटासेट और वास्तुकला के साथ प्रशिक्षित है। डिस्टिल्ड मॉडल डेल एक बड़े मॉडल के साथ सीखता है, जो जेम्मा नहीं करता है।

संगठन अक्सर एक मॉडल में कुछ उपयोग के मामलों को फिट करना पसंद करते हैं। O3-Mini या क्लाउड 7.7 Sonnet जैसे LLM को तैनात करने के बजाय, एक साधारण कोड संपादक, एक छोटा मॉडल, चाहे SLM या एक डिस्टिल्ड संस्करण, एक बड़े मॉडल को ओवरलोड किए बिना आसानी से उन कार्यों को कर सकता है।

Scroll to Top