तकनीकी
- प्रबुद्ध
एआई-जनित पाठ और वीडियो के लिए हमारे उपन्यास वॉटरमार्किंग विधि की घोषणा, और हम कैसे Google उत्पादों के लिए सिंथेशन ला रहे हैं
जनरेटिव एआई टूल – और उनके पीछे बड़ी भाषा मॉडल प्रौद्योगिकियां – सार्वजनिक कल्पना पर कब्जा कर लिया है। कार्यात्मक कार्यों का उपयोग करके रचनात्मकता को बढ़ाने तक, ये उपकरण तेजी से उन उत्पादों का हिस्सा बन रहे हैं जो उनके दैनिक जीवन में लाखों लोगों का उपयोग किया जाता है।
ये प्रौद्योगिकियां बेहद फायदेमंद हो सकती हैं, लेकिन जैसे-जैसे वे अधिक से अधिक उपयोग करते हैं, एआई-जनित सामग्री को ठीक से पहचाना नहीं जाता है, आकस्मिक या जानबूझकर गलत जानकारी और फ़िशिंग बढ़ने का जोखिम बढ़ जाता है। इसीलिए पिछले साल, हमने एआई-जनित सामग्री टारमार्किंग के लिए अपना उपन्यास डिजिटल टूलकिट सिंथिड लॉन्च किया।
आज, हम मिथुन ऐप और वेब एक्सपायरशन में वॉटरमार्क एआई-जनित पाठ में सिंथिड की क्षमताओं का विस्तार कर रहे हैं, और वीओ में वीडियो, हमारे सबसे सक्षम वीडियो मॉडल।
पाठ के लिए सिंथिड को सबसे उपलब्ध एआई टेक्स्ट जेनरेशन मॉडल डेलो और एक पैमाने पर तैनात करने के लिए डिज़ाइन किया गया है, जबकि वीडियो के लिए सिंटिड को हमारी छवि और ऑडियो डीओ वॉटरमार्किंग विधि पर उत्पन्न वीडियो में सभी फ्रेम शामिल करने के लिए बनाया गया है। इस अभिनव विधि ने पाठ या वीडियो पीढ़ी प्रक्रिया की गुणवत्ता, सटीकता, रचनात्मकता या गति को प्रभावित किए बिना एक एहतियाती वॉटरमार्क को एम्बेड किया।
सिंथिड एआई उत्पन्न सामग्री की पहचान करने के लिए एक चांदी की गोली नहीं है, लेकिन अधिक विश्वसनीय एआई पहचान उपकरण विकसित करने के लिए एक महत्वपूर्ण बिल्डिंग ब्लॉक है और एआई-जनित सामग्री के साथ बातचीत करने के बारे में लाखों जानकार निर्णयों में मदद कर सकता है। इस गर्मी में बाद में, हम टेक्स्ट वॉटरमार्किंग के लिए सिनथेड सोर्स की योजना बना रहे हैं, ताकि डेवलपर्स इस तकनीक का निर्माण कर सकें और इसे अपने मॉडल में समायोजित कर सकें।
पाठ वॉटरमार्किंग कैसे काम करता है
बड़े भाषा के मॉडल डेलस पाठ के अनुक्रमों का उत्पादन करते हैं, जब संकेत दिया जाता है, “मुझे क्वांटम यांत्रिकी की व्याख्या करें जैसे मैं पाँच हूँ” या “आपका पसंदीदा फल क्या है?”। LLMS भविष्यवाणी करता है कि कौन सा टोकन सबसे अधिक बार दूसरे का अनुसरण करता है, एक समय में एक टोकन।
टोकन ऐसे ब्लॉकों का निर्माण कर रहे हैं जो प्रसंस्करण जानकारी के लिए एक सामान्य मॉडल का उपयोग करते हैं। इस मामले में, वे एक चरित्र, शब्द या वाक्य का हिस्सा हो सकते हैं। प्रत्येक संभावित टोकन को एक स्कोर सौंपा गया है, जो उचित होने के लिए एक प्रतिशत अवसर है। उच्च स्कोर वाले टोकन का उपयोग किए जाने की संभावना है। LLMS संगत प्रतिक्रिया बनाने के लिए इन चरणों को दोहराता है।
सिंथिड को सीधे पाठ उत्पादन प्रक्रिया में समझ से बाहर वॉटरमार्क को एम्बेड करने के लिए डिज़ाइन किया गया है। यह टोकन का उत्पादन करने की संभावना को संशोधित करके करता है – वेतन उत्पादन के चरण में टोकन वितरण में अतिरिक्त जानकारी प्रस्तुत करके – सभी गुणवत्ता, सटीकता, रचनात्मकता या पाठ पीढ़ी की गति से समझौता किए बिना।
सिंथिड एक बड़े भाषा मॉडल द्वारा उत्पादित टोकन की संभावना स्कोर को समायोजित करता है।
समायोजित संभाव्यता स्कोर से जुड़े दोनों मॉडलों के शब्द विकल्पों के लिए स्कोर का अंतिम पैटर्न एक वॉटरमार्क माना जाता है। स्कोर के इस पैटर्न की तुलना वॉटरमार्क और अनियोजित पाठ के लिए स्कोर के अपेक्षित पैटर्न के साथ की जाती है, जो एआई टूल टेक्स्ट का उत्पादन करती है, या यह सिंथिड को खोजने में मदद करती है कि क्या यह अन्य स्रोतों से आ सकता है।
मिथुन द्वारा उत्पन्न पाठ का एक टुकड़ा एक वॉटरमार्क के साथ नीले रंग में जलाया।
इस तकनीक के फायदे और सीमाएँ
जब एक भाषा मॉडल लंबी प्रतिक्रियाएं पैदा करता है, और विभिन्न तरीकों से – जैसे कि एक निबंध, थिएटर स्क्रिप्ट या ईमेल को विविधता का उत्पादन करने के लिए कहा जाता है, तो पाठ वॉटरमार्किंग के लिए सिंथिड सबसे अच्छा काम करते हैं।
यह कुछ बदलावों के तहत भी अच्छा प्रदर्शन करता है, जैसे कि फसल की फसल के टुकड़े, कुछ शब्दों में बदलने और हल्के ढंग से पैराफ्रेज़। हालांकि, जब एआई-जनित पाठ को पूरी तरह से फिर से लिखा या किसी अन्य भाषा में अनुवादित किया जाता है, तो इसके आत्मविश्वास स्कोर को बहुत कम किया जा सकता है।
सिंथिड टेक्स्ट वॉटरमार्किंग तथ्य संकेतों के उत्तरों पर कम प्रभावी है क्योंकि तथ्य की सटीकता को प्रभावित किए बिना टोकन वितरण को समायोजित करने की संभावना कम है। “फ़्रांस की राजधानी कौनसी है?” जैसे संकेत शामिल हैं? या ऐसे प्रश्न जहां कम या किसी भी अंतर की उम्मीद की जाती है, जैसे “विलियम वर्ड्सवर्थ कविता का पाठ”।
कई वर्तमान में एआई डिटेक्शन टूल्स लेबलिंग और रट सीज़ को लेबल करने के लिए एल्गोरिदम का उपयोग करते हैं, जिसे क्लासिफाइड के रूप में जाना जाता है। ये क्लासिफाइड अक्सर केवल कुछ कार्यों पर अच्छा प्रदर्शन करते हैं, जिससे वे कम लचीले होते हैं। जब एक ही क्लासिफायर विभिन्न प्रकार के प्लेटफार्मों और सामग्रियों पर लागू होता है, तो इसका प्रदर्शन हमेशा विश्वसनीय या संगत नहीं होता है। यह एक पाठ को गुमराह कर सकता है, जो समस्याओं का कारण बन सकता है, उदाहरण के लिए, जहां पाठ को गलत तरीके से एआई-जनित के रूप में संदर्भित किया जाता है।
सिंथिड अपने आप प्रभावी रूप से काम करता है, लेकिन इसे सामग्री प्रकारों और प्लेटफार्मों पर बेहतर कवरेज प्रदान करने के लिए अन्य एआई खोजी दृष्टिकोणों के साथ भी जोड़ा जा सकता है। जबकि इस तकनीक को साइबरटेकर या हैकर्स जैसे प्रेरित प्रतिद्वंद्वियों को सीधे रोकने के लिए डिज़ाइन नहीं किया गया है, यह दुर्भावनापूर्ण उद्देश्यों के लिए एआई-जनित सामग्री का उपयोग करना मुश्किल बना सकता है।
वीडियो वॉटरमार्किंग कैसे काम करता है
इस वर्ष के I/O पर हम अपने सबसे सक्षम जेनेरिक वीडियो मॉडल VEO की घोषणा करते हैं। जबकि वीडियो पीढ़ी प्रौद्योगिकियां छवि पीढ़ी तकनीकों के रूप में व्यापक रूप से उपलब्ध नहीं हैं, वे तेजी से बढ़ रहे हैं और लोगों को यह जानने में मदद कर रहे हैं कि क्या वीडियो एआई द्वारा निर्मित है।
वीडियो व्यक्तिगत फ्रेम या अभी भी छवियों से बने होते हैं। इसलिए हमने छवि उपकरण के लिए हमारे सिंथेस से प्रेरित एक वॉटरमार्किंग तकनीक विकसित की। यह तकनीक वॉटरमार्क को सीधे प्रत्येक वीडियो फ्रेम के पिक्सेल में एम्बेड करती है, जो इसे मानव आंख के लिए अस्पष्ट बनाती है, लेकिन पहचान के लिए पाया जा सकता है।
जुनवेलेज के साथ कनावलेज के साथ सशक्त बनाना एआई-जनित मीडिया के साथ बातचीत करते समय झूठी जानकारी के प्रसार को रोकने में मदद करने में महत्वपूर्ण भूमिका निभा सकता है। आज से, VOOFX पर VOOFX द्वारा उत्पन्न सभी वीडियो को सिंथाइड द्वारा वॉटरमार्क किया जाएगा।
सिंथिड वीडियो वीटर टर्मरिंग वीडियो के प्रत्येक फ्रेम को चिह्नित करता है
एक व्यापक एआई पारिस्थितिकी तंत्र पर एक सिंथिड लाना
सिंथिड की टेक्स्ट वॉटरमार्किंग तकनीक, अधिकांश एआई टेक्स्ट जेनरेशन मॉडल और इसे अलग -अलग सामग्री प्रकार बनाने और प्लेटफ़ॉर्म पर स्केलिंग करने के लिए डिज़ाइन किया गया है। एआई-जनित सामग्रियों के व्यापक दुरुपयोग को रोकने के लिए, हम इस तकनीक को एक व्यापक एआई पारिस्थितिकी तंत्र में लाने पर काम कर रहे हैं।
इस गर्मी में, हम एक विस्तृत शोध पत्र में अपनी पाठ वॉटरमार्किंग तकनीक के बारे में अधिक प्रकाशित करने की योजना बना रहे हैं, और हम अपने अद्यतन जेनेरिक एआई टूलकिट के माध्यम से स्रोत स्रोत पाठ वॉटरमार्किंग को खोलेंगे, जो एक सुरक्षित एआई एप्लिकेशन बनाने के लिए मार्गदर्शन और आवश्यक उपकरण प्रदान करता है। , इसलिए डेवलपर्स इस तकनीक के साथ निर्माण कर सकते हैं और इसे अपने मॉडल में समायोजित कर सकते हैं।
पावती
सिंटिड टेक्स्ट वॉटरमार्किंग प्रोजेक्ट का नेतृत्व सुमनाथ दातरी और पुशमिट कोहली ने किया, जिसमें प्रमुख अनुसंधान और इंजीनियरिंग योगदान (सूचीबद्ध अक्षर): बचानी, सुमेद गिसास, पो-सेन हुआंग, रॉब एमआई डैम, एबी सी और जॉन।
प्रोजेक्ट शुरू करने में मदद करने के लिए पो-सेन हुआंग और जोहान्स वेलबल को धन्यवाद। ब्रैड हैकमैन, सीआईपी बाटू, एनआईआर शबट, निकोला डल सैंटो, वेलेंटिन एंकलिन और माजिद अल मेरी को उत्पाद एकीकरण पर सहयोग के लिए धन्यवाद; तकनीकी इनपुट और ब्रे एनर्जी बेले, रूडी मेड, टेलन सेमगिल, स्वान गॉवल, जेमी हेज़, एलेक्स कास्कसोली, इल्या शुमिलोव, तातियाना मटेज़ोविकोवा और रॉबर्ट स्टैनफोर्थ। कई लोगों के लिए धन्यवाद, जो Google DeepMind और Google में योगदान करते हैं, जिसमें मिथुन और हमारे जर्मल के हमारे भागीदार शामिल हैं।
सिंथिड वीडियो-वाटर टर्मार्किंग प्रोजेक्ट का नेतृत्व स्वैन गौवल और पुशमिट कोहली ने किया था, जिसमें मुख्य योगदान (सूचीबद्ध वर्णमाला): रूडी मेड, क्रिस्टीना कुरीदी, गिलर्मो ओर्टेस-जेमेनेज़, सिल्वेस्ट्रियन स्टीबर्ग, सिल्वेस्टी-फ्लोरिस्ट। ऊपर सूचीबद्ध जेमी हेस और अन्य लोगों को धन्यवाद।
सिंटिड उत्पाद वितरण को चलाने के लिए निपी व्यास और ज़हरा अहमद के लिए धन्यवाद।