टेंसेंट एआई शोधकर्ताओं ने हुनुआन-टी 1 का परिचय दिया: एक माम्बा-संचालित अल्ट्रा-बिग भाषा मॉडल, डीप पंडो लॉजिक, जिसमें संदर्भित दक्षता और मानव-केंद्रित सुदृढीकरण शिक्षा का उल्लेख है।

बड़ी भाषा मॉडल डेलस आवश्यक संदर्भ को खोए बिना लंबे, जटिल ग्रंथों की प्रक्रिया और कारण के लिए संघर्ष करता है। पारंपरिक मॉडल अक्सर संदर्भ के नुकसान से पीड़ित होते हैं, लंबे समय तक निर्भरता निर्भरता के अक्षम प्रबंधन और मानव वरीयताओं के साथ संरेखण, जो उनके उत्तरों की सटीकता और दक्षता को प्रभावित करते हैं। तनावपूर्ण हुनुआन-टी 1 सीधे इन चुनौतियों को हल करता है, जो उन्नत सुदृढीकरण शिक्षा और पाठ्यक्रम रणनीति के साथ उपन्यास मंबा-संचालित वास्तुकला को एकीकृत करके इन चुनौतियों को हल करता है, मजबूत संदर्भ कैप्चर और बढ़ाया तर्क क्षमताओं को बढ़ाता है।

हुनुआन-टी 1 अभिनव मंबा आर्किटेक्चर द्वारा संचालित पहला मॉडल है, जो एक डिज़ाइन है जो हाइब्रिड ट्रांसफार्मर और मिक्स-एफ-विशेषज्ञों (एमओई) तकनीकों को फ़्यूज़ करता है। टर्बोस फास्ट-टिंकिंग बेस पर निर्मित, हुनुआन-टी 1 विशेष रूप से कम्प्यूटेशनल ओवरहेड को कम करते हुए लंबे कपड़ा अनुक्रमों की प्रक्रिया को ize करने के लिए इंजीनियर है। यह मॉडल को प्रभावी ढंग से विस्तृत संदर्भ पर कब्जा करने और कार्यों के लिए एक महत्वपूर्ण, सुसंगत तर्क की मांग करते हुए एक लंबे समय तक निर्भरता का प्रबंधन करने की अनुमति देता है।

प्रशिक्षण के बाद के चरण के दौरान हुनुआन-टी 1 का मुख्य आकर्षण आरएल पर इसकी भारी निर्भरता है। इस दृष्टिकोण के लिए अपनी कंप्यूटिंग शक्ति का 96.7% समर्पित है, जिससे मॉडल को अपनी तर्क क्षमताओं को दोहराने में सक्षम बनाया गया है। डेटा रिप्ले, आवधिक नीति और स्व-लाल प्रतिक्रिया लूप जैसी तकनीक आउटपुट की गुणवत्ता में सुधार करने में मदद करती है, यह सुनिश्चित करें कि मॉडल के उत्तर विस्तृत, कुशल और मानवीय अपेक्षाओं के साथ निकटता से जुड़े हैं।

लॉजिक की विशेषज्ञता में तेजी लाने के लिए, टेंसेंट ने एक पाठ्यक्रम सीखने की रणनीति सीखने के लिए काम किया। यह दृष्टिकोण धीरे -धीरे प्रशिक्षण डेटा की समस्या को बढ़ाता है जबकि एक साथ मॉडल की संदर्भ लंबाई का विस्तार करता है। नतीजतन, हुनुआन-टी 1 को अधिक प्रभावी ढंग से टोकन का उपयोग करने के लिए प्रशिक्षित किया जाता है, जटिल दुश्मन और तार्किक चुनौतियों से निपटने के लिए बुनियादी गणितीय समस्याओं को हल करने के लिए समान अनुकूलन। दक्षता हुनुआन-टी 1 के डिजाइन की दूसरी नींव है। टर्बोज़ बेस की लंबी-पहचाने जानकारी को कैप्चर करने की क्षमता संदर्भ क्षति को रोकती है, कई भाषा मॉडल में एक सामान्य मुद्दा है, और एक ही सिस्टम की तुलना में डिकोडिंग गति को दोगुना करता है। इस प्रगति का मतलब है कि उपयोगकर्ता समझौता किए बिना तेज, उच्च गुणवत्ता वाले उत्तरों से लाभान्वित होते हैं।

मॉडल डेल ने कई बेंचमार्क पर प्रभावशाली स्कोर हासिल किया है: MMLU-PRO.2 87.1 पर, जो मानवता, सामाजिक बुद्धिमान; SAN और STEM क्षेत्र सहित विभिन्न विषयों का परीक्षण करता है; 69.3 GPQA-Diamonds में, एक चुनौतीपूर्ण मूल्यांकन जिसमें डॉक्टरेट स्तर के दुश्मन थे; कई समस्याएं हैं; कोडिंग कार्यों के लिए लाइव रोडबांच पर 64.9; और गणितीय तर्क के लिए, बेंचमार्क पर गणितीय -500 महत्वपूर्ण 96.2। ये परिणाम विभिन्न क्षेत्रों में हुनुआन-टी 1 और उच्च-पारी, पेशेवर-ग्रेड कार्यों की बहुमुखी प्रतिभा को रेखांकित करते हैं। मात्रात्मक मैट्रिक्स से परे, हुनुआन-टी 1 को मानव समझ और रचनात्मकता के साथ आउटपुट देने के लिए डिज़ाइन किया गया है। अपने आरएल चरण के दौरान, मॉडल डेल एक व्यापक संरेखण प्रक्रिया के माध्यम से चला गया जो बाहरी इनाम मॉडल के साथ आत्म-शुद्ध प्रतिक्रिया को जोड़ता है। यह दोहरी दृष्टिकोण यह सुनिश्चित करता है कि इसके उत्तर सटीक हैं और समृद्ध विवरण और प्राकृतिक प्रवाह प्रदर्शित करते हैं।

अंत में, तनाव का हुनुआन-टी 1 अल्ट्रा-बिग-स्केल, मंबा-संचालित वास्तुकला को एक अत्याधुनिक सुदृढीकरण शिक्षा और पाठ्यक्रम रणनीति के साथ जोड़ता है। हुनुआन-टी 1 उच्च प्रदर्शन, बढ़ाया तर्क और असाधारण दक्षता प्रदान करता है।


जाँच करना विवरण, गले का चेहरा और GitHub पेज। इस शोध के लिए सभी श्रेय इस परियोजना के शोधकर्ताओं को जाते हैं। इसके अलावा, हमें फॉलो करने के लिए स्वतंत्र महसूस करें ट्विटर और हमसे जुड़ने के लिए मत भूलना 85 k+ ml सबमिटेड


ASIF Razzaq एक दूरदर्शी उद्यमी और इंजीनियर के रूप में मार्केटएकपोस्ट मीडिया इंक के सीईओ हैं, ASIF सामाजिक अच्छे के लिए कृत्रिम बुद्धिमत्ता की संभावना को बढ़ाने के लिए प्रतिबद्ध है। उनका सबसे हालिया प्रयास आर्टिफिशियल इंटेलिजेंस मीडिया प्लेटफॉर्म, मार्कटेकपोस्ट का उद्घाटन है, जो मशीन लर्निंग की गहराई के लिए और कवरेज की गहराई के लिए गहरी सीखने की खबर के लिए है। यह तकनीकी रूप से ध्वनि है और एक बड़े दर्शकों द्वारा आसानी से समझ में आता है। प्लेटफ़ॉर्म में 2 मिलियन से अधिक मासिक दृश्य हैं, जो दर्शकों के बीच अपनी लोकप्रियता दिखाते हैं।

You might also enjoy

Subscribe Our Newsletter

Scroll to Top