30 से अधिक वर्षों के लिए, विजय .an फोटोग्राफर फेलिस फ्रैंकल ने MIT प्रोफेसरों, शोधकर्ताओं और छात्रों को अपने काम को नेत्रहीन रूप से संवाद करने में मदद की है। उस समय के दौरान, उसने आकर्षक छवियों के निर्माण का समर्थन करने के लिए विभिन्न उपकरणों के विकास को देखा है: कुछ सहायक, और कुछ कुछ शोध प्रस्तुत करने के लिए विश्वसनीय और पूर्ण प्रयासों के विरोध में हैं। हाल के राय भाग में प्रकाशित प्रकृति मैगज़ीन, फ्रेंकल, छवियों में कृत्रिम बुद्धिमत्ता (GENI) उत्पन्न करने के बढ़ते उपयोग और अनुसंधान को संप्रेषित करने की चुनौतियों और प्रभावों पर चर्चा करता है। अधिक व्यक्तिगत नोट पर, वह सवाल करती है कि क्या अनुसंधान समुदाय में फोटोग्राफर के लिए अभी भी एक जगह है।
क्यू: आपने उल्लेख किया है कि फोटो लेने के रूप में छवि को “हेरफेर” माना जा सकता है। एक दृश्य बनाने के लिए आपने अपनी खुद की छवियों में हेरफेर किया है जो अधिक सफलतापूर्वक वांछित संदेश से संपर्क करते हैं। स्वीकार्य और अस्वीकार्य हेरफेर के बीच की रेखा कहाँ है?
ए: व्यापक अर्थों में, छवि सामग्री को फ्रेम और डिज़ाइन करने के तरीके पर निर्णय, जिसके साथ एक छवि बनाने के लिए उपयोग किए जाने वाले उपकरण पहले से ही वास्तविकता में हेरफेर कर रहे हैं। हमें यह याद रखने की जरूरत है कि छवि सिर्फ उस चीज का प्रतिनिधित्व है, न कि केवल उस चीज का। छवि बनाते समय निर्णय किए जाने चाहिए। महत्वपूर्ण मुद्दा डेटा में हेरफेर करने के लिए नहीं है, और अधिकांश छवियों के मामले में, डेटा संरचना। उदाहरण के लिए, एक छवि के लिए मैंने कुछ समय पहले बनाया था, मैंने डिजिटल रूप से पैट्री डिश को हटा दिया था जिसमें कॉलोनी के अद्भुत आकारिकी पर ध्यान आकर्षित करने के लिए किण्वित कॉलोनी बढ़ रही थी। छवि डेटा कॉलोनी की आकृति विज्ञान है। मैंने उस डेटा को धोखा नहीं दिया है। हालांकि, अगर मैंने एक छवि में कुछ किया तो मैं हमेशा पाठ में सुझाव दूंगा। मैं अपनी हैंडबुक, “विजुअल एलिमेंट्स, फोटोग्राफी” में छवि वृद्धि के विचार पर चर्चा करता हूं।
क्यू: शोधकर्ता यह सुनिश्चित करने के लिए क्या कर सकते हैं कि उनके शोध को ठीक से और नैतिक रूप से संवाद किया गया है?
ए: एआई के आगमन के साथ, मुझे दृश्य प्रस्तुति से संबंधित तीन मुख्य मुद्दे दिखाई देते हैं: चित्र और प्रलेखन के बीच का अंतर, डिजिटल हेरफेर के आसपास नैतिकता, और दृश्य संचार में शोधकर्ताओं को प्रशिक्षित करने की निरंतर आवश्यकता है। इन वर्षों में, मैं विजय और बैन और इंजीनियरिंग शोधकर्ताओं के वर्तमान और आगामी वर्गों के लिए एक दृश्य साक्षरता कार्यक्रम विकसित करने की कोशिश कर रहा हूं। एमआईटी संचार की आवश्यकता है जो ज्यादातर लेखन को संबोधित करती है, लेकिन दृश्य के बारे में क्या है, जो अब एक पत्रिका प्रस्तुत करने के लिए स्पर्शनीय नहीं है? मैं शर्त लगाऊंगा कि वर्चुअल लेखों के अधिकांश पाठकों ने सार को पढ़ने के बाद आंकड़ों के बारे में पढ़ा।
हमें यह सीखने की ज़रूरत है कि छात्रों को कैसे देखा जाए कि कैसे एक हाइलाइट किए गए ग्राफ या छवि को देखा जाए और यह तय किया जाए कि इसके साथ कुछ अजीब चलना है या नहीं। हमें एक निश्चित पूर्व निर्धारित तरीके से देखने के लिए “एनडीजिंग” की नैतिकता के बारे में एक छवि पर चर्चा करने की आवश्यकता है। मैं लेख में एक घटना का वर्णन करता हूं जब छात्र ने मेरी छवियों में से एक को बदल दिया (मुझसे बिना पूछे) उस छात्र से मेल खाने के लिए जो नेत्रहीन संवाद करना चाहता था। मैंने निश्चित रूप से इसकी अनुमति नहीं दी, और निराश था कि इस तरह के बदलाव की नैतिकता को ध्यान में नहीं रखा गया था। हमें बहुत कम से कम संवाद करने और परिसरों में बेहतर विकसित करने की आवश्यकता है, लेखन की आवश्यकता के साथ, दृश्य साक्षरता बनाने की आवश्यकता है।
क्यू: जेनेरिक एआई को हटाया नहीं जा रहा है। बुद्धि? नेत्रहीन संवाद करने के लिए आप भविष्य के रूप में क्या देखते हैं?
ए: यह प्रकृति लेख, मैंने फैसला किया है कि छवियों के निर्माण में एआई के उपयोग पर सवाल उठाने का शक्तिशाली तरीका उदाहरण द्वारा था। मैंने निम्नलिखित प्रॉम्प्ट का उपयोग करके एक छवि बनाने के लिए प्रसार मॉडल में से एक का उपयोग किया:
“उनके आकार के आधार पर जब यूवी रोशनी से उत्साहित, अलग -अलग तरंग दैर्ध्य पर प्रतिदीप्ति, काली पृष्ठभूमि के सामने शीशियों में मूक बावेंडी के नैनो क्रिस्टल की एक तस्वीर बनाते हैं।”
मेरे एआई प्रयोग के परिणाम अक्सर कार्टून जैसी छवियां थीं जो शायद ही कभी वास्तविकता के रूप में पारित हो सकती हैं, लेकिन अकेले एक समय होगा जब वे होंगे। समुदायों में अनुसंधान और कंप्यूटर-उम्र के समुदायों में सहकर्मियों के साथ एक बातचीत में, सभी इस बात से सहमत हैं कि हमारे पास स्पष्ट मानक हैं कि हमारे पास क्या है और क्या अनुमति नहीं है। और सबसे महत्वपूर्ण बात, एक जननांग दृश्य को कभी भी एक प्रलेखन के रूप में अनुमति नहीं दी जानी चाहिए।
लेकिन एआई-जनित दृश्य, वास्तव में, दृष्टांत उद्देश्यों के लिए उपयोगी होंगे। यदि एआई-जनित दृश्य एक पत्रिका को प्रस्तुत करना है (या, उस मामले में, प्रस्तुति में दिखाया गया है), मेरा मानना है कि शोधकर्ता की आवश्यकता है
- स्पष्ट रूप से लेबल किया जाता है यदि एक छवि एआई मॉडल द्वारा बनाई गई थी;
- इंगित करता है कि किस मॉडल का उपयोग किया गया था;
- शामिल करें कि किस प्रॉम्प्ट का इस्तेमाल किया गया था; और
- छवि डालें, यदि कोई है, जिसका उपयोग प्रॉम्प्ट की मदद करने के लिए किया गया था।