एआई की उम्र में अनुसंधान की कल्पना

March 14, 2025

Dr. Ashish V

फेलिस फ्रेंकल (बाएं) और उसी सामग्री की एआई-जनित छवि द्वारा ली गई मूल तस्वीर। क्रेडिट: फेलिस फ्रेंकल। सही L-E के साथ उत्पन्न किया गया था

मेलानी एम काफमैन द्वारा

30 से अधिक वर्षों के लिए, विजय .an फोटोग्राफर फेलिस फ्रैंकल ने MIT प्रोफेसरों, शोधकर्ताओं और छात्रों को अपने काम को नेत्रहीन रूप से संवाद करने में मदद की है। उस समय के दौरान, उसने आकर्षक छवियों के निर्माण का समर्थन करने के लिए विभिन्न उपकरणों के विकास को देखा है: कुछ सहायक, और कुछ कुछ शोध प्रस्तुत करने के लिए विश्वसनीय और पूर्ण प्रयासों के विरोध में हैं। नेचर मैगज़ीन में प्रकाशित हाल के ओपिनियन पार्ट में, फ्रैंकेले ने छवियों में कृत्रिम बुद्धिमत्ता (GNI) उत्पन्न करने के बढ़ते उपयोग और अनुसंधान को संप्रेषित करने की चुनौतियों और प्रभावों पर चर्चा की। अधिक व्यक्तिगत नोट पर, वह सवाल करती है कि क्या अनुसंधान समुदाय में फोटोग्राफर के लिए अभी भी एक जगह है।

क्यू: आपने उल्लेख किया है कि फोटो लेने के रूप में छवि को “हेरफेर” माना जा सकता है। एक दृश्य बनाने के लिए आपने अपनी खुद की छवियों में हेरफेर किया है जो अधिक सफलतापूर्वक वांछित संदेश से संपर्क करते हैं। स्वीकार्य और अस्वीकार्य हेरफेर के बीच की रेखा कहाँ है?

ए: व्यापक अर्थों में, छवि सामग्री को फ्रेम और डिज़ाइन करने के तरीके पर निर्णय, जिसके साथ एक छवि बनाने के लिए उपयोग किए जाने वाले उपकरण पहले से ही वास्तविकता में हेरफेर कर रहे हैं। हमें यह याद रखने की जरूरत है कि छवि सिर्फ उस चीज का प्रतिनिधित्व है, न कि केवल उस चीज का। छवि बनाते समय निर्णय किए जाने चाहिए। महत्वपूर्ण मुद्दा डेटा में हेरफेर करने के लिए नहीं है, और अधिकांश छवियों के मामले में, डेटा संरचना। उदाहरण के लिए, एक छवि के लिए मैंने कुछ समय पहले बनाया था, मैंने डिजिटल रूप से पैट्री डिश को हटा दिया था जिसमें कॉलोनी के अद्भुत आकारिकी पर ध्यान आकर्षित करने के लिए किण्वित कॉलोनी बढ़ रही थी। छवि डेटा कॉलोनी की आकृति विज्ञान है। मैंने उस डेटा को धोखा नहीं दिया है। हालांकि, अगर मैंने एक छवि में कुछ किया तो मैं हमेशा पाठ में सुझाव दूंगा। मैं अपनी हैंडबुक, “विजुअल एलिमेंट्स, फोटोग्राफी” में छवि वृद्धि के विचार पर चर्चा करता हूं।

एक बढ़ती किण्वन कॉलोनी की एक छवि जहां पैट्री व्यंजन को डिजिटल रूप से हटा दिया गया है। फ्रेंकल कहते हैं कि इस प्रकार का हेरफेर स्वीकार्य हो सकता है क्योंकि वास्तविक डेटा में हेरफेर नहीं किया गया है। छवि क्रेडिट: फेलिस फ्रेंकल

क्यू: शोधकर्ता यह सुनिश्चित करने के लिए क्या कर सकते हैं कि उनके शोध को ठीक से और नैतिक रूप से संवाद किया गया है?

ए: एआई के आगमन के साथ, मुझे दृश्य प्रस्तुति से संबंधित तीन मुख्य मुद्दे दिखाई देते हैं: चित्र और प्रलेखन के बीच का अंतर, डिजिटल हेरफेर के आसपास नैतिकता, और दृश्य संचार में शोधकर्ताओं को प्रशिक्षित करने की निरंतर आवश्यकता है। इन वर्षों में, मैं विजय और बैन और इंजीनियरिंग शोधकर्ताओं के वर्तमान और आगामी वर्गों के लिए एक दृश्य साक्षरता कार्यक्रम विकसित करने की कोशिश कर रहा हूं। एमआईटी संचार की आवश्यकता है जो ज्यादातर लेखन को संबोधित करती है, लेकिन दृश्य के बारे में क्या है, जो अब एक पत्रिका प्रस्तुत करने के लिए स्पर्शनीय नहीं है? मैं शर्त लगाऊंगा कि वर्चुअल लेखों के अधिकांश पाठकों ने सार को पढ़ने के बाद आंकड़ों के बारे में पढ़ा।

हमें यह सीखने की ज़रूरत है कि छात्रों को कैसे देखा जाए कि कैसे एक हाइलाइट किए गए ग्राफ या छवि को देखा जाए और यह तय किया जाए कि इसके साथ कुछ अजीब चलना है या नहीं। हमें एक निश्चित पूर्व निर्धारित तरीके से देखने के लिए “एनडीजिंग” की नैतिकता के बारे में एक छवि पर चर्चा करने की आवश्यकता है। मैं लेख में एक घटना का वर्णन करता हूं जब छात्र ने मेरी छवियों में से एक को बदल दिया (मुझसे बिना पूछे) उस छात्र से मेल खाने के लिए जो नेत्रहीन संवाद करना चाहता था। मैंने निश्चित रूप से इसकी अनुमति नहीं दी, और निराश था कि इस तरह के बदलाव की नैतिकता को ध्यान में नहीं रखा गया था। हमें बहुत कम से कम संवाद करने और परिसरों में बेहतर विकसित करने की आवश्यकता है, लेखन की आवश्यकता के साथ, दृश्य साक्षरता बनाने की आवश्यकता है।

क्यू: जेनेरिक एआई को हटाया नहीं जा रहा है। बुद्धि? नेत्रहीन संवाद करने के लिए आप भविष्य के रूप में क्या देखते हैं?

ए: एक प्रकृति लेख के लिए, मैंने फैसला किया है कि एआई से पूछताछ करने का शक्तिशाली तरीका उदाहरण द्वारा छवियों के निर्माण में था। मैंने निम्नलिखित प्रॉम्प्ट का उपयोग करके एक छवि बनाने के लिए प्रसार मॉडल में से एक का उपयोग किया:

“उनके आकार के आधार पर जब यूवी रोशनी से उत्साहित, अलग -अलग तरंग दैर्ध्य पर प्रतिदीप्ति, काली पृष्ठभूमि के सामने शीशियों में मूक बावेंडी के नैनो क्रिस्टल की एक तस्वीर बनाते हैं।”

मेरे एआई प्रयोग के परिणाम अक्सर कार्टून जैसी छवियां थीं जो शायद ही कभी वास्तविकता के रूप में पारित हो सकती हैं, लेकिन अकेले एक समय होगा जब वे होंगे। समुदायों में अनुसंधान और कंप्यूटर-उम्र के समुदायों में सहकर्मियों के साथ एक बातचीत में, सभी इस बात से सहमत हैं कि हमारे पास स्पष्ट मानक हैं कि हमारे पास क्या है और क्या अनुमति नहीं है। और सबसे महत्वपूर्ण बात, एक जननांग दृश्य को कभी भी एक प्रलेखन के रूप में अनुमति नहीं दी जानी चाहिए।

लेकिन एआई-जनित दृश्य, वास्तव में, दृष्टांत उद्देश्यों के लिए उपयोगी होंगे। यदि एआई-जनित दृश्य को किसी पत्रिका को प्रस्तुत किया जाना है (या, उस मामले में, प्रस्तुति में दिखाया गया है), मेरा मानना है कि शोधकर्ता की आवश्यकता है:

स्पष्ट रूप से लेबल किया जाता है यदि एक छवि एआई मॉडल द्वारा बनाई गई थी;
इंगित करता है कि किस मॉडल का उपयोग किया गया था;
शामिल करें कि किस प्रॉम्प्ट का इस्तेमाल किया गया था; और
छवि डालें, यदि कोई है, जिसका उपयोग प्रॉम्प्ट की मदद करने के लिए किया गया था।

मीट न्यूज

एआई की उम्र में अनुसंधान की कल्पना

Dr. Ashish V

You might also enjoy

Google’s breakup trial shapes AI’s future

Bank Peon Notification: बैंक चपरासी एवं ड्राइवर पदों पर भर्ती योग्यता 10वीं 12वीं पास आवेदन शुरू

एआई ब्लॉकचेन: यह वास्तव में क्या है?

Subscribe Our Newsletter

Deep See K.A.R.T. S.Pace