नवीनतम अपडेट और प्रमुख एआई कवरेज पर विशिष्ट सामग्री के लिए हमारे दैनिक और साप्ताहिक समाचार पत्र में शामिल हों। और अधिक जानें
कनाडाई एआई स्टार्टअप कोह्र ने 2019 में विशेष रूप से उद्यम को लक्षित किया, लेकिन स्वतंत्र शोध ने दिखाया है कि यह ओपनईए और एन्थ्रोपिक जैसे प्रतिद्वंद्वी मालिकाना मॉडल प्रदाताओं की तुलना में तीसरे पक्ष के डेवलपर्स में बाजार हिस्सेदारी हासिल करने के लिए संघर्ष कर रहा है, चीनी ओपन-प्रतिद्वंद्वियों का उल्लेख नहीं करने के लिए।
फिर भी, इसके ings ने फुर्रिंग को बढ़ावा देना जारी रखा है: आज, एआई के लिए इसके लाभदायक अनुसंधान विभाग ने अपने पहले विज़न मॉडल, एया विज़न, एक मल्टीमॉडल एआई मॉडल को पेश करने के लिए एक नया खुला वजन की घोषणा की, जो कोह्र में भाषा और दृष्टि क्षमताओं और “अर्ध -यूडी”, “अर्ध -यूडेंस” को एकीकृत करता है। विस्तृत अधिकार, “वाइड राइटियन को स्पाइड करें,” विभिन्न भाषाओं में अंतर देता है।
AYA विजन को AI की छवियों की व्याख्या करने, पाठ बनाने और दृश्य सामग्री को एक प्राकृतिक भाषा में अनुवाद करने की क्षमता को बढ़ाने के लिए डिज़ाइन किया गया है, जिससे बहुभाषी AI को अधिक सुलभ और प्रभावी बना दिया गया है। यह विशेष रूप से विभिन्न भाषा विकल्पों के साथ दुनिया भर के कई बाजारों में काम करने वाले उद्योगों और संगठनों के लिए सहायक होगा।
यह अब Corherb की वेबसाइट और AI कोड समुदायों पर क्रिएटिव कॉन्स मैन्स एट्रिबस-नॉन-कमर्शियल इंटरनेशनल .1 इंटरनेशनल (CC द्वारा NC 4.0) के तहत उपलब्ध है, जिससे शोधकर्ताओं और डेवलपर्स को गैर-पेशेवर उद्देश्यों के लिए मॉडल का उपयोग करने और साझा करने की अनुमति मिलती है।
इसके अलावा, AYA विजन व्हाट्सएप द्वारा उपलब्ध है, जिससे उपयोगकर्ता सीधे एक परिचित वातावरण में मॉडल से संपर्क कर सकते हैं।
दुर्भाग्य से, यह उद्यम और भुगतान किए गए एप्लिकेशन या मनीमेकिंग वर्कफ़्लो के लिए एक इंजन के रूप में इसके उपयोग को सीमित करता है।
यह 8 बिलियन और 32 बिलियन आयाम संस्करणों में आता है (आयाम एआई मॉडल में आंतरिक सेटिंग्स की संख्या को संदर्भित करते हैं, जिसमें इसका वजन और पूर्वाग्रह शामिल है, आमतौर पर एक अधिक शक्तिशाली और प्रदर्शन करने वाले मॉडल का संकेत देता है)।
23 भाषाओं और गिनती का समर्थन करता है
यद्यपि प्रतिद्वंद्वियों के एआई मॉडल कई भाषाओं में पाठ को समझ सकते हैं, लेकिन दृष्टि-आधारित कार्यों के लिए इस क्षमता का विस्तार करना एक चुनौती है।
लेकिन अया विजन छवि-टायन पैशन का उत्पादन करके, दृश्य प्रश्नों का उत्तर देने, छवियों का अनुवाद करने और भाषाओं के विभिन्न सेटों में पाठ-आधारित भाषा कार्यों को देने से उपयोगकर्ताओं को समाप्त कर देता है:
1। अंग्रेजी
2। फ्रेंच
3। जर्मन
4। स्पेनिश
5। इतालवी
6। पुर्तगाली
7। जापानी
8। कोरियाई
9। चीनी
10। अरबी
11। ग्रीक
12। फारसी
13। पोलिश
14। इंडोनेशियाई
15। जाँच करें
16। हिब्रू
17। हिंदी
18। डच
19। रोमानियाई
20। रूसी
21। तुर्की
22। यूक्रेनी
23। वियतनामी
अपने ब्लिट पोस्ट पोस्ट में, कोर ने दिखाया कि कैसे एया विज़न उत्पाद पैकेजिंग पर छवि और पाठ का विश्लेषण कर सकता है और अनुवाद या खुलासे प्रदान कर सकता है। यह विभिन्न संस्कृतियों से कला शैलियों की पहचान और वर्णन कर सकता है, उपयोगकर्ताओं को एआई-रन विजुअल समझ के माध्यम से वस्तुओं के बगैक्ट और परंपराओं के बारे में जानने में मदद कर सकता है।

AYA दृष्टि क्षमताओं का कई क्षेत्रों में व्यापक प्रभाव पड़ता है:
• भाषा शिक्षा और शिक्षा: उपयोगकर्ता कई भाषाओं में छवियों का अनुवाद और वर्णन कर सकते हैं, जिससे शैक्षिक सामग्री अधिक सुलभ हो सकती है।
• सांस्कृतिक रखरखाव: यह मॉडल कला, स्थलों और ऐतिहासिक लयबद्ध कलाकृतियों के इतिहास के विस्तृत विवरण का उत्पादन कर सकता है, जो कि कम भाषाओं में सांस्कृतिक प्रलेखन का समर्थन करते हैं।
• एक्सेस xcecibility Toits: विज़न-आधारित एआई अपनी मूल भाषा में विस्तृत छवि विवरण प्रदान करके दृष्टिगत रूप से बिगड़ा हुआ उपयोगकर्ताओं की मदद कर सकता है।
• वैश्विक संचार: वास्तविक समय मल्टीमॉडल अनुवाद निकायों और व्यक्तियों को भाषाओं में अधिक प्रभावी ढंग से संवाद करने में सक्षम बनाता है।
अग्रणी बेंचमार्क में मजबूत प्रदर्शन और उच्च दक्षता
AYA विजन की स्टैंडआउट सुविधाओं में से एक इसकी कार्यक्षमता और मॉडल आकार है। यद्यपि कुछ प्रमुख मल्टीमॉडल मॉडल डेलो की तुलना में काफी छोटे हैं, अया विजन ने कई प्रमुख बेंचमार्क में कई प्रमुख विकल्पों को उन्नत किया है।
YAA विज़न 8B लामा 90 बी से बेहतर प्रदर्शन करता है, जो 11 गुना बड़ा है।
हां अया विजन 32 बी क्वीन 72 बी, लालमा 90 बी और मोल्मो 72 बी आउटपरफॉर्म, वे सभी कम से कम दो बार (या अधिक) कम से कम दो बार हैं।
वाईए एविएशन सिनच और एम-वाइल्डविज़न अया विज़न 8 बी पर बेंचमार्किंग परिणाम दिखाते हैं कि विजेता दर 79% तक है, और एया विजन 32 बी बहुभाषी छवि समझ कार्यों में 3% जीत दरों तक पहुंचती है।
दक्षता की दृश्य तुलना AYA दृष्टि के लाभों पर प्रकाश डालती है। दक्षता बनाम। जैसा कि प्रदर्शन ट्रेड-ग्राफ एफ ग्राफ में दिखाया गया है, एया विज़न 8 बी और 32 बी अपने आयाम आकार से संबंधित सबसे अच्छी-कक्षा प्रदर्शनियों का प्रदर्शन करते हैं, कम्प्यूटेशनल दक्षता बनाए रखते हुए बड़े मॉडल को आगे बढ़ाते हैं।

तकनीकी नवाचार जो दृष्टि को मजबूत करते हैं
AI Etibut AIA विज़न के प्रदर्शन के लिए कई प्रमुख नवाचारों को प्राप्त करने के लिए संगत:
• कृत्रिम ओटी नोट: मॉडल मल्टीमॉडल कार्यों पर प्रशिक्षण बढ़ाने के लिए कृत्रिम डेटा उत्पादन का लाभ प्रदान करता है।
• बहुभाषी डेटा स्केलिंग: भाषाओं में डेटा का अनुवाद और दोहराकर, मॉडल बहुभाषी संदर्भों की एक व्यापक समझ देता है।
• मल्टीमॉडल मॉडल मर्ज: उन्नत तकनीकें समग्र प्रदर्शन में सुधार करते हुए दृष्टि और भाषा मॉडल दोनों की अंतर्दृष्टि को जोड़ती हैं।
ये प्रगति मजबूत बहुभाषी क्षमताओं को बनाए रखते हुए दृष्टि को अधिक सटीकता के साथ छवियों और पाठ को संसाधित करने की अनुमति देती है।
स्टेप-परफॉर्मेंस इम्प्रूवमेंट चार्ट से पता चलता है कि सिंथेटिक फाइन-ट्यूनिंग (एसएफटी), मॉडल मर्जिंग और स्केलिंग सहित अतिरिक्त नवाचारों ने एया विजन की उच्च जीत दरों में योगदान दिया है।

उद्यम निर्णयों के लिए
AYA विजन के उद्यम को स्पष्ट रूप से खानपान के बावजूद, व्यवसायों के पास अपने प्रतिबंधित गैर-वाणिज्यिक लाइसेंसिंग शब्दों के साथ इसका उपयोग करने में कठिन समय हो सकता है।
फिर भी, सीईओ, सीटीओ, आईटी नेता और एआई शोधकर्ता अपने संस्थानों में मॉडल का उपयोग कर सकते हैं, विशेष रूप से अनुसंधान, प्रोटोटाइपिंग और बेंचमार्किंग में, ए-संचालित बहुभाषी और मल्टीमॉडल क्षमताओं का पता लगाने के लिए।
उद्यम अभी भी आंतरिक अनुसंधान और विकास के लिए इसका उपयोग कर सकता है, बहुभाषी एआई संचालन का मूल्यांकन कर सकता है, और मल्टीमॉडल अनुप्रयोगों के साथ प्रयोग कर सकता है।
CTOS और AI टीमों को AYA विजन को एक बहुत ही कुशल, ओपन वेट मॉडल के रूप में मूल्यवान मिलेगा जो कम गणना संसाधनों की आवश्यकता होने पर कई बड़े विकल्पों की ओर जाता है।
यह स्वामित्व वाले मॉडल डेलो के खिलाफ बेंचमार्किंग के लिए एक उपयोगी उपकरण बनाता है, संभावित एआई -पावर समाधानों की खोज करता है, और वाणिज्यिक तैनाती रणनीति के लिए प्रतिबद्धता से पहले बहुभाषी मल्टीमॉडल इंटरैक्शन का परीक्षण करता है।
डेटा VYJ के लिए।
इसका खुला स्रोत प्रकृति और हार्ड-बेंचमार्क मॉडल व्यवहार का अध्ययन करने के लिए एक पारदर्शी नींव प्रदान करता है, गैर-वाणिज्यिक सेटिंग्स में ठीक-ठीक ट्यूनिंग और एआई प्रगति को खोलने में योगदान करने के लिए।
आंतरिक अनुसंधान, शैक्षणिक सहयोग या एआई नैतिकता मूल्यांकन के लिए उपयोग किया जाता है, AYA विजन बहुभाषी और मल्टीमॉडल AI-स्वामित्व वाले कारनामों के लिए एक अत्याधुनिक स्रोत के रूप में कार्य करता है, मालिक की रुकावट के बिना, बंद-स्रोत मॉडल।
खुला स्रोत अनुसंधान और सहयोग
अया विजन AYA का हिस्सा है, जो AI और संबंधित तकनीक को अधिक पॉलीटर्म बनाने पर ध्यान केंद्रित करने वाले सहसंबंध द्वारा एक व्यापक पहल है।
फरवरी 2024 में इसके लॉन्च के बाद से, AYA आरंभकर्ता ने 119 देशों में 3,000 से अधिक स्वतंत्र शोधकर्ताओं के वैश्विक अनुसंधान समुदाय को रोक दिया है, जो भाषा AI मॉडल में सुधार करने के लिए मिलकर काम कर रहा है।
उद्घाटन के उद्घाटन के लिए अपनी प्रतिबद्धता को आगे बढ़ाने के लिए, कोहर ने चेहरे पर AYA विजन 8B और 32B दोनों के लिए खुला वजन प्रकाशित किया है, यह सुनिश्चित करते हुए कि दुनिया भर में शोधकर्ता मॉडल और प्रयोग तक पहुंच का उपयोग कर सकते हैं। इसके अलावा, एआई के लिए संगतता एविएशनबैंचमार्क को प्रस्तुत करती है, जो एक नया बहुभाषी दृष्टि मूल्यांकन है जो मल्टीमॉडल एआई के लिए एक कठोर मूल्यांकन संरचना प्रदान करने के लिए डिज़ाइन किया गया है।
एक ओपन -वाइट मॉडल डेल के रूप में AAYA विज़न की उपलब्धता बहुभाषी AI अनुसंधान को अधिक शामिल और सुलभ बनाने के लिए एक महत्वपूर्ण कदम है।
AY विजन खर्च की सफलता पर बनाता है, AI के लिए दूसरा LLM परिवार, बहुभाषी AI पर ध्यान केंद्रित करता है। मल्टीमॉडल एआई पर ध्यान केंद्रित करके, एआई के लिए संगत शोधकर्ताओं, डेवलपर्स और व्यवसायों को अपने वर्कफ़्लो में बहुभाषी एआई को एकीकृत करने के मुख्य साधन के रूप में एया विजन की जगह ले रहे हैं।
जैसा कि AIA पहल विकसित होती रहती है, AI ने आने वाले हफ्तों में एक नए सहयोगी अनुसंधान प्रयास शुरू करने की योजना की भी घोषणा की है। बहुभाषी एआई प्रगति में योगदान देने में रुचि रखने वाले शोधकर्ताओं और डेवलपर्स ओपन विज कम्युनिटी समुदाय में शामिल हो सकते हैं या एक शोध अनुदान के लिए आवेदन कर सकते हैं।
अभी के लिए, AYA विजन की रिहाई बहुभाषी मल्टीमॉडल AI में एक महत्वपूर्ण छलांग प्रस्तुत करती है, उच्च प्रदर्शन, खुले वजन समाधान की पेशकश करती है जो बड़े, बंद-स्रोत मॉडल के प्रभुत्व को चुनौती देती है। ये प्रगति व्यापक अनुसंधान समुदाय के लिए उपलब्ध हैं, जो एआई के लिए एआई-संचालित बहुभाषी संचार में संभव है की सीमाओं को पूरा करती है।
वीबी दैनिक के साथ पेशेवर उपयोग के मामलों पर दैनिक अंतर्दृष्टि
यदि आप अपने बॉस को प्रभावित करना चाहते हैं, तो वीबी ने आपको हर दिन कवर किया है। हम आपको एक अंदर के स्कूप देते हैं कि विनियामक शिफ्ट से लेकर प्रैक्टिकल परिनियोजन तक की कंपनियां एआई उत्पन्न करने के साथ क्या कर रही हैं, इसलिए आप अधिकतम आरओआई के लिए अंतर्दृष्टि साझा कर सकते हैं।
हमारी गोपनीयता नीति पढ़ें
सदस्यता के लिए धन्यवाद। यहां और अधिक वीबी न्यूज़लेटर्स देखें।
एक त्रुटि पाई गई।
