लंदन -आधारित एआई लैब ओडिसी ने इंटरैक्टिव दुनिया में ट्रांसफॉर्मिंग मॉडल का एक शोध पूर्वावलोकन शुरू किया है। प्रारंभ में, फिल्म और गेम निर्माण के लिए विश्व मॉडल डेलो पर ध्यान केंद्रित करके, ओडिसी टीम संभावित रूप से पूरी तरह से नए मनोरंजन माध्यम पर ठोकर खाई है।
ओडिसी के एआई मॉडल द्वारा उत्पन्न इंटरैक्टिव वीडियो वास्तविक समय में इनपुट का जवाब देता है। आप अपने कीबोर्ड, फोन, नियंत्रक से संपर्क कर सकते हैं या अंततः आवाज का उपयोग कर सकते हैं कमांड है। ओडिसी के लोग इसे “होलोडेक के प्रारंभिक संस्करण” के रूप में बिलिंग कर रहे हैं।
अंतर्निहित एआई 40 मिलीसेकंड पर वास्तविक -आकर्षक वीडियो फ्रेम का उत्पादन कर सकता है। इसका मतलब है कि जब आप दबाते हैं या इशारा करते हैं, तो वीडियो लगभग तुरंत प्रतिक्रिया देता है – यह भ्रम पैदा करता है कि आप वास्तव में इस डिजिटल दुनिया को प्रभावित कर रहे हैं।
ओडिसी के अनुसार, ओडिसी के अनुसार, “आज का अनुभव एक अस्पष्ट सपने की तरह दिखता है – कच्चा, अस्थिर, लेकिन निर्विवाद,”। हम पॉलिश, एएए-गेम गुणवत्ता वाले दृश्य के बारे में बात नहीं कर रहे हैं, कम से कम अभी तक नहीं।
आपका मानक वीडियो तकनीक नहीं है
आइए एक पल के लिए कुछ तकनीक प्राप्त करें। यह एआई-जनित इंटरैक्टिव वीडियो तकनीक, एक मानक वीडियो गेम या सीजीआई से अलग क्या बनाता है? यह सब कुछ ओडिसी “वर्ल्ड मॉडल” कहता है।
पारंपरिक वीडियो मॉडल डेल्ट्स के विपरीत, जो एक बार में पूर्ण क्लिप का उत्पादन करते हैं, विश्व मॉडल वर्तमान स्थिति की भविष्यवाणी करने के लिए फ्रेम-दर-फ्रेम काम करते हैं और किसी भी उपयोगकर्ता इनपुट के आधार पर आगे क्या आना चाहिए। यह वैसा ही है जैसा कि डेलो ऑर्डर में बड़े भाषा मॉडल में अगले शब्द की भविष्यवाणी करें, लेकिन अनंत अधिक जटिल क्योंकि हम शब्दों के बजाय उच्च-रिज़ॉल्यूशन वीडियो फ्रेम के बारे में बात कर रहे हैं।
“विश्व मॉडल, अपने मूल में, एक एक्शन-वातानुकूलित डायनेमिक्स मॉडल है,” ओडिसी ने इसे रखा है। हर बार जब आप बातचीत करते हैं, तो मॉडल वर्तमान स्थिति, आपकी कार्रवाई और क्या हुआ, का इतिहास लेता है, फिर अगले वीडियो फ्रेम को तदनुसार उत्पन्न करता है।
परिणाम कुछ ऐसा है जो एक पारंपरिक खेल की तुलना में अधिक कार्बनिक और अप्रत्याशित दिखता है। कोई शर्त नहीं है कि “यदि कोई खिलाड़ी एक्स करता है, तो आप करते हैं” -टू करते हैं, एआई सबसे अच्छा अनुमान लगा रहा है कि कई वीडियो देखकर क्या सीखा जाता है, इस पर क्या किया जाना चाहिए।
ओडिसी एआई-जनित वीडियो के साथ ऐतिहासिक गांजा चुनौतियों का सामना करता है
इस तरह से कुछ बनाना पार्क में बिल्कुल पैदल नहीं है। एआई-जनित इंटरैक्टिव वीडियो के साथ सबसे बड़ी बाधाएं इसे समय के साथ स्थिर रखने के लिए हैं। जब आप पिछले वाले के आधार पर प्रत्येक फ्रेम का उत्पादन कर रहे हैं, तो छोटी त्रुटियां जल्दी से गठबंधन कर सकती हैं (एक घटना एआई शोधकर्ता “बहाव” कहते हैं।)
इससे निपटने के लिए, ओडिसी ने उन्हें “संकीर्ण वितरण मॉडल” के रूप में संदर्भित किया है-यह सामान्य वीडियो फुटेज पर अपने एआई को पूर्व-प्रतिभाशाली है, फिर इसे अच्छी तरह से वातावरण के एक छोटे से सेट पर ट्यूनिंग करता है। यह व्यापार-एएस का अर्थ है कम विविधता लेकिन बेहतर स्थिरता तो सब कुछ अजीब नहीं हो जाता है।
कंपनी का कहना है कि वे पहले से ही अपने अगले-सामान्य मॉडल पर “तेजी से प्रगति” कर रहे हैं, जो स्पष्ट रूप से “पिक्सेल, गतिशीलता और कार्यों की अधिक समृद्ध रेंज” दिखाता है।
वास्तविक समय में इन सभी फैंसी एआई टेक को चलाना सस्ता नहीं है। वर्तमान में, इस अनुभव को मजबूत करने वाला बुनियादी ढांचा यूएस और यूरोपीय संघ में एच 100 जीपीयू के समूहों पर निर्भर करता है, 80 0.80- £ 1.60 (1-2) प्रति उपयोगकर्ता-घंटे के बीच।
यह वीडियो स्ट्रीमिंग के लिए महंगा लगता है, लेकिन यह पारंपरिक खेल या फिल्म सामग्री के निर्माण की तुलना में काफी सस्ता है। और ओडिसी को उम्मीद है कि मॉडल अधिक कुशल हो जाएंगे और लागत अधिक परेशान होगी।
इंटरैक्टिव वीडियो: अगली कहानी बताने के लिए मध्यम?
पूरे इतिहास में, नई तकनीकों ने कहानी कहने के नए रूपों को जन्म दिया है – गुफा चित्रों से लेकर किताबें, फोटोग्राफी, रेडियो, फिल्म और वीडियो गेम तक। ओडिसी का मानना है कि एआई-जनित इंटरैक्टिव वीडियो इस विकास में अगला कदम है।
यदि यह उचित है, तो हम मनोरंजन, शिक्षा, विज्ञापन और बहुत कुछ लाने वाली किसी चीज़ के प्रोटोटाइप को देखेंगे। प्रशिक्षण वीडियो की कल्पना करें जहां आप सिखाए गए कौशल का अध्ययन कर सकते हैं, या उन अनुभवों की यात्रा कर सकते हैं जहां आप अपने सोफे के साथ स्थानों का पता लगा सकते हैं।
अब उपलब्ध शोध पूर्वावलोकन स्पष्ट रूप से इस दृष्टि की दिशा में एक छोटा कदम है और तैयार उत्पादन के बजाय अवधारणा के सबूत हैं। हालांकि, इस बात की एक दिलचस्प झलक है कि जब एआई-जनित दुनिया केवल निष्क्रिय अनुभवों के बजाय इंटरैक्टिव खेल के मैदान बन जाती है तो क्या संभव है।
आप एक शोध पूर्वावलोकन आज़मा सकते हैं यह यहाँ है।
यह भी देखें: टेलीग्राम और ज़ाई फोर्ज ग्रॉक एआई सौदा

उद्योग के नेताओं से एआई और बड़े डेटा के बारे में अधिक जानना चाहते हैं? एम्स्टर्डम, कैलिफोर्निया और लंदन में आयोजित एआई और बिग डेटा एक्सपो की जाँच करें। ब्रॉड इवेंट को इंटेलिजेंट ऑटो टोमेशन कॉन्फ्रेंस, ब्लॉकएक्स, डिजिटल ट्रांसफॉर्मेशन वीक और साइबर सिक्योरिटी एंड क्लाउड एक्सपो सहित अन्य प्रमुख घटनाओं के साथ सह-स्थित किया गया है।
TechFire द्वारा संचालित अन्य आगामी उद्यम प्रौद्योगिकी घटनाओं और वेबिनार का अन्वेषण करें।