अलीबाबा ने WAN2.1-WES का अनावरण किया है, एक खुला स्रोत AI मॉडल जिसे हमने बनाया और वीडियो संपादित करने के लिए डिज़ाइन किया गया है।
वेस पतली हवा के साथ दिखाई नहीं दे रहा है; यह अलीबाबा के व्यापक WAN2.1 वीडियो एआई मॉडल डेलो के परिवार का हिस्सा है। और वे इसके लिए एक साहसिक दावा कर रहे हैं, यह कहते हुए कि यह उद्योग में पहला खुला स्रोत मॉडल है जो विभिन्न वीडियो पीढ़ी और संपादन कार्यों के लिए एकीकृत निपटान प्रदान करता है। “
यदि अलीबाबा कई की ओर विभिन्न उपकरणों को हिलाकर उपयोगकर्ताओं को खत्म करने में सफल हो सकता है, तो एक सुव्यवस्थित हब-यह एक सच्चा स्पोर्ट्स-चेंजर हो सकता है।
तो, यह बात वास्तव में क्या कर सकती है? खैर, शुरुआती लोगों के लिए, यह सभी प्रकार के संकेतों का उपयोग करके वीडियो को कोड़ा मार सकता है, जिसमें टेक्स्ट कमांड, स्टिल पिक्चर्स और अन्य वीडियो क्लिप स्निपेट शामिल हैं।
लेकिन यह शुरू से ही सिर्फ वीडियो नहीं बना रहा है। टूलकिट एआई संपादन उन्नत वीडियो “पश्चाताप” (सेकंड में अधिक) को निर्देशित करने के लिए छवियों या विशेष फ्रेम का समर्थन करता है, न केवल आपके मौजूदा वीडियो के चयनित बिट्स को सही ठहराते हुए, और वीडियो को खींचकर भी। अलीबाबा इन विशेषताओं को सक्षम बनाता है “रचनात्मकता बढ़ाने के लिए विभिन्न कार्यों के लचीले संयोजन।”

कल्पना कीजिए कि आप विशिष्ट वर्णों की बातचीत के साथ एक वीडियो बनाना चाहते हैं, शायद आपके पास कुछ तस्वीरों के आधार पर। WES यह करने में सक्षम होने का दावा करता है। क्या स्थिर छवि गतिशील थी जो आप चाहते थे? अलीबाबा का ओपन सोर्स एआई मॉडल इसे जीवन में लाने के लिए एक प्राकृतिक -दिखने वाला आंदोलन जोड़ सकता है।
जो लोग फाइन-ट्यून करना पसंद करते हैं, उनके लिए उन्नत “वीडियो पश्चाताप” कार्य हैं जो मैंने पहले उल्लेख किए हैं। इनमें एक विषय से दूसरे विषय में ट्रांसफर करने जैसी चीजें शामिल हैं, गति का कुछ नियंत्रण, गहराई की दृष्टि को समायोजित करना और बदलते रंगों को।
एक विशेषता जिसने मेरी आंख को पकड़ा है, वह यह है कि “वातावरण को प्रभावित किए बिना वीडियो के चयनात्मक विशिष्ट क्षेत्रों में वीडियो को जोड़ने, बदलने या समर्थन करने की क्षमता।” यह विस्तृत संपादन के लिए एक बहुत बड़ा प्लस है – जब आप एक छोटे तत्व को उड़ाने की कोशिश कर रहे हों तो पृष्ठभूमि में गलती से गड़बड़ न करें। इसके अलावा, यह आपके वीडियो कैनवास को बड़ा बना सकता है और सब कुछ अधिक समृद्ध और अधिक विस्तृत दिखने के लिए प्रासंगिक सामग्रियों के साथ सब कुछ भर सकता है।
आप एक फ्लैट तस्वीर ले सकते हैं, इसे एक वीडियो में बदल सकते हैं, और उन वस्तुओं को बता सकते हैं कि कैसे एक तरह से ड्राइंग को स्थानांतरित करें। एक संदर्भ के रूप में आपके द्वारा प्रदान की जाने वाली किसी चीज़ के साथ एक चरित्र या ऑब्जेक्ट bugg का आदान -प्रदान करने की आवश्यकता है? कोई बात नहीं। उन संदर्भित पात्रों को जियो? किया निश्चित रूप से उनके मुद्रा को नियंत्रित करता है? आपको यह मिला।
अलीबाबा अपने ओपन-सन एआई मॉडल का एक उदाहरण भी प्रदान करता है, जो लंबा, पतला ical BHI छवि लेता है और चतुराई से इसे एक वाइडस्क्रीन वीडियो में विस्तारित करता है, स्वचालित रूप से अन्य छवियों या संकेतों का उल्लेख करके नए बिट्स और टुकड़ों को जोड़ता है। यह बहुत साफ है।
बेशक, वेस सिर्फ जादू नहीं है। इसमें कुछ चतुर तकनीकें शामिल हैं, जो वीडियो एडिटिंग की अक्सर-गूढ़ वास्तविकता को संभालने के लिए डिज़ाइन किए गए हैं। मुख्य हिस्सा यह है कि अलीबाबा ला वीडियो स्थिति इकाई (VCU) को कॉल करता है, जो कि टेक्स्ट, इमेज, वीडियो और मास्क जैसे मल्टीमॉडल इनपुट की एकीकृत प्रक्रिया का समर्थन करता है। “
तब उन्हें “संदर्भ एडाप्टर संरचनाएं” कहा जाता है। इंजीनियरिंग का यह चतुर बिट “लौकिक और स्थानिक मापदंडों के औपचारिक चित्र प्रतिनिधित्व का उपयोग करके विभिन्न कार्यों की अवधारणाओं को इंजेक्ट करता है।” अनिवार्य रूप से, एआई को वीडियो के भीतर समय और स्थान की वास्तव में अच्छी समझ के रूप में सोचें।
इस सभी चतुर तकनीक के साथ, अलीबाबा कुछ क्षेत्रों में गंध को मारा जाएगा। फास्ट सोशल मीडिया क्लिप, आंख को पकड़ने वाले विज्ञापन और विपणन सामग्री, फिल्म और टीवी के लिए भारी-शुल्क पोस्ट-प्रोडक्शन विशेष प्रभाव, और कस्टम शैक्षिक और प्रशिक्षण वीडियो बनाने के लिए विचार।
Alibaba ai प्यार फैलाने के लिए Wan2.1-wes ओपन-सन बनाता है
इन शक्तिशाली एआई मॉडल को बनाना आम तौर पर भाग्य की लागत के लायक होता है और इसे बड़ी मात्रा में कंप्यूटिंग पावर और टन डेटा की आवश्यकता होती है। तो, अलीबाबा Wan2.1- क्या वेस खुला स्रोत बनाता है? यह एक बड़ी बात है।
अलीबाबा बताते हैं, “ओपन एक्सेस एआई का लाभ उठाने के लिए अधिक व्यवसायों के लिए बाधाओं को कम करने में मदद करता है, उन्हें अपनी आवश्यकताओं को बनाने में सक्षम बनाता है, तेजी से और महंगी और महंगी उच्च गुणवत्ता वाली दृश्य सामग्री।”
मूल रूप से, अलीबाबा को उम्मीद है कि छोटे व्यवसायों और व्यक्तिगत रचनाकारों-बैंक को और अधिक लोगों द्वारा तोड़ने के बिना शीर्ष स्तरीय एआई पर हाथ पाने की उम्मीद है। शक्तिशाली उपकरणों का यह लोकतंत्रीकरण हमेशा एक स्वागत योग्य परिदृश्य है।
और वे सिर्फ एक संस्करण नहीं छोड़ते हैं। गंभीर हॉर्सपावर वाले लोगों के लिए एक 14 बिलियन आयाम मॉडल है, और लाइटर सेटअप के लिए एक अधिक से अधिक चुस्त या चतुर 1.3 बिलियन आयाम है। अब आप उन्हें चेहरे पर और गिटथब पर या अलीबाबा क्लाउड के अपने ओपन सोर्स कम्युनिटी, मॉडलोकोप द्वारा मुफ्त में पकड़ सकते हैं।
(छवि स्रोत: www.alibabagroup.com)
यह भी देखें: ब्रेक स्लैम्स ऑन यूएस एआई डिफ्यूजन रूल, चिप एक्सपोर्ट्स टू एक्सपोर्ट कर्ब्स

उद्योग के नेताओं से एआई और बड़े डेटा के बारे में अधिक जानना चाहते हैं? एम्स्टर्डम, कैलिफोर्निया और लंदन में आयोजित एआई और बिग डेटा एक्सपो की जाँच करें। ब्रॉड इवेंट को इंटेलिजेंट ऑटो टोमेशन कॉन्फ्रेंस, ब्लॉकएक्स, डिजिटल ट्रांसफॉर्मेशन वीक और साइबर सिक्योरिटी एंड क्लाउड एक्सपो सहित अन्य प्रमुख घटनाओं के साथ सह-स्थित किया गया है।
TechFire द्वारा संचालित अन्य आगामी उद्यम प्रौद्योगिकी घटनाओं और वेबिनार का अन्वेषण करें।