फेलिस फ्रेंकल (बाएं) और उसी सामग्री की एआई-जनित छवि द्वारा ली गई मूल तस्वीर। क्रेडिट: फेलिस फ्रेंकल। सही L-E के साथ उत्पन्न किया गया था
मेलानी एम काफमैन द्वारा
30 से अधिक वर्षों के लिए, विजय .an फोटोग्राफर फेलिस फ्रैंकल ने MIT प्रोफेसरों, शोधकर्ताओं और छात्रों को अपने काम को नेत्रहीन रूप से संवाद करने में मदद की है। उस समय के दौरान, उसने आकर्षक छवियों के निर्माण का समर्थन करने के लिए विभिन्न उपकरणों के विकास को देखा है: कुछ सहायक, और कुछ कुछ शोध प्रस्तुत करने के लिए विश्वसनीय और पूर्ण प्रयासों के विरोध में हैं। नेचर मैगज़ीन में प्रकाशित हाल के ओपिनियन पार्ट में, फ्रैंकेले ने छवियों में कृत्रिम बुद्धिमत्ता (GNI) उत्पन्न करने के बढ़ते उपयोग और अनुसंधान को संप्रेषित करने की चुनौतियों और प्रभावों पर चर्चा की। अधिक व्यक्तिगत नोट पर, वह सवाल करती है कि क्या अनुसंधान समुदाय में फोटोग्राफर के लिए अभी भी एक जगह है।
क्यू: आपने उल्लेख किया है कि फोटो लेने के रूप में छवि को “हेरफेर” माना जा सकता है। एक दृश्य बनाने के लिए आपने अपनी खुद की छवियों में हेरफेर किया है जो अधिक सफलतापूर्वक वांछित संदेश से संपर्क करते हैं। स्वीकार्य और अस्वीकार्य हेरफेर के बीच की रेखा कहाँ है?
ए: व्यापक अर्थों में, छवि सामग्री को फ्रेम और डिज़ाइन करने के तरीके पर निर्णय, जिसके साथ एक छवि बनाने के लिए उपयोग किए जाने वाले उपकरण पहले से ही वास्तविकता में हेरफेर कर रहे हैं। हमें यह याद रखने की जरूरत है कि छवि सिर्फ उस चीज का प्रतिनिधित्व है, न कि केवल उस चीज का। छवि बनाते समय निर्णय किए जाने चाहिए। महत्वपूर्ण मुद्दा डेटा में हेरफेर करने के लिए नहीं है, और अधिकांश छवियों के मामले में, डेटा संरचना। उदाहरण के लिए, एक छवि के लिए मैंने कुछ समय पहले बनाया था, मैंने डिजिटल रूप से पैट्री डिश को हटा दिया था जिसमें कॉलोनी के अद्भुत आकारिकी पर ध्यान आकर्षित करने के लिए किण्वित कॉलोनी बढ़ रही थी। छवि डेटा कॉलोनी की आकृति विज्ञान है। मैंने उस डेटा को धोखा नहीं दिया है। हालांकि, अगर मैंने एक छवि में कुछ किया तो मैं हमेशा पाठ में सुझाव दूंगा। मैं अपनी हैंडबुक, “विजुअल एलिमेंट्स, फोटोग्राफी” में छवि वृद्धि के विचार पर चर्चा करता हूं।
एक बढ़ती किण्वन कॉलोनी की एक छवि जहां पैट्री व्यंजन को डिजिटल रूप से हटा दिया गया है। फ्रेंकल कहते हैं कि इस प्रकार का हेरफेर स्वीकार्य हो सकता है क्योंकि वास्तविक डेटा में हेरफेर नहीं किया गया है। छवि क्रेडिट: फेलिस फ्रेंकल
क्यू: शोधकर्ता यह सुनिश्चित करने के लिए क्या कर सकते हैं कि उनके शोध को ठीक से और नैतिक रूप से संवाद किया गया है?
ए: एआई के आगमन के साथ, मुझे दृश्य प्रस्तुति से संबंधित तीन मुख्य मुद्दे दिखाई देते हैं: चित्र और प्रलेखन के बीच का अंतर, डिजिटल हेरफेर के आसपास नैतिकता, और दृश्य संचार में शोधकर्ताओं को प्रशिक्षित करने की निरंतर आवश्यकता है। इन वर्षों में, मैं विजय और बैन और इंजीनियरिंग शोधकर्ताओं के वर्तमान और आगामी वर्गों के लिए एक दृश्य साक्षरता कार्यक्रम विकसित करने की कोशिश कर रहा हूं। एमआईटी संचार की आवश्यकता है जो ज्यादातर लेखन को संबोधित करती है, लेकिन दृश्य के बारे में क्या है, जो अब एक पत्रिका प्रस्तुत करने के लिए स्पर्शनीय नहीं है? मैं शर्त लगाऊंगा कि वर्चुअल लेखों के अधिकांश पाठकों ने सार को पढ़ने के बाद आंकड़ों के बारे में पढ़ा।
हमें यह सीखने की ज़रूरत है कि छात्रों को कैसे देखा जाए कि कैसे एक हाइलाइट किए गए ग्राफ या छवि को देखा जाए और यह तय किया जाए कि इसके साथ कुछ अजीब चलना है या नहीं। हमें एक निश्चित पूर्व निर्धारित तरीके से देखने के लिए “एनडीजिंग” की नैतिकता के बारे में एक छवि पर चर्चा करने की आवश्यकता है। मैं लेख में एक घटना का वर्णन करता हूं जब छात्र ने मेरी छवियों में से एक को बदल दिया (मुझसे बिना पूछे) उस छात्र से मेल खाने के लिए जो नेत्रहीन संवाद करना चाहता था। मैंने निश्चित रूप से इसकी अनुमति नहीं दी, और निराश था कि इस तरह के बदलाव की नैतिकता को ध्यान में नहीं रखा गया था। हमें बहुत कम से कम संवाद करने और परिसरों में बेहतर विकसित करने की आवश्यकता है, लेखन की आवश्यकता के साथ, दृश्य साक्षरता बनाने की आवश्यकता है।
क्यू: जेनेरिक एआई को हटाया नहीं जा रहा है। बुद्धि? नेत्रहीन संवाद करने के लिए आप भविष्य के रूप में क्या देखते हैं?
ए: एक प्रकृति लेख के लिए, मैंने फैसला किया है कि एआई से पूछताछ करने का शक्तिशाली तरीका उदाहरण द्वारा छवियों के निर्माण में था। मैंने निम्नलिखित प्रॉम्प्ट का उपयोग करके एक छवि बनाने के लिए प्रसार मॉडल में से एक का उपयोग किया:
“उनके आकार के आधार पर जब यूवी रोशनी से उत्साहित, अलग -अलग तरंग दैर्ध्य पर प्रतिदीप्ति, काली पृष्ठभूमि के सामने शीशियों में मूक बावेंडी के नैनो क्रिस्टल की एक तस्वीर बनाते हैं।”
मेरे एआई प्रयोग के परिणाम अक्सर कार्टून जैसी छवियां थीं जो शायद ही कभी वास्तविकता के रूप में पारित हो सकती हैं, लेकिन अकेले एक समय होगा जब वे होंगे। समुदायों में अनुसंधान और कंप्यूटर-उम्र के समुदायों में सहकर्मियों के साथ एक बातचीत में, सभी इस बात से सहमत हैं कि हमारे पास स्पष्ट मानक हैं कि हमारे पास क्या है और क्या अनुमति नहीं है। और सबसे महत्वपूर्ण बात, एक जननांग दृश्य को कभी भी एक प्रलेखन के रूप में अनुमति नहीं दी जानी चाहिए।
लेकिन एआई-जनित दृश्य, वास्तव में, दृष्टांत उद्देश्यों के लिए उपयोगी होंगे। यदि एआई-जनित दृश्य को किसी पत्रिका को प्रस्तुत किया जाना है (या, उस मामले में, प्रस्तुति में दिखाया गया है), मेरा मानना है कि शोधकर्ता की आवश्यकता है:
- स्पष्ट रूप से लेबल किया जाता है यदि एक छवि एआई मॉडल द्वारा बनाई गई थी;
- इंगित करता है कि किस मॉडल का उपयोग किया गया था;
- शामिल करें कि किस प्रॉम्प्ट का इस्तेमाल किया गया था; और
- छवि डालें, यदि कोई है, जिसका उपयोग प्रॉम्प्ट की मदद करने के लिए किया गया था।
मीट न्यूज