अजनबियों की एक कंपनी के साथ, डिजिटल दुनिया की अपील मानसिक स्वास्थ्य सहायता खोजने के लिए एक जगह के रूप में बढ़ रही है। यह घटना इस तथ्य के बारे में उत्साहित है कि संयुक्त राज्य अमेरिका में 150 मिलियन से अधिक लोग संघीय मानसिक स्वास्थ्य की कमी वाले क्षेत्रों में रहते हैं।
“मुझे वास्तव में आपकी मदद की ज़रूरत है, क्योंकि मैं एक चिकित्सक से बात करने से बहुत डरता हूं और मैं वैसे भी नहीं पहुंच सकता।”
“क्या मैं अपने दोस्तों के बारे में दुखी महसूस कर रहा हूं?”
“क्या कुछ अजनबी कृपया मेरे जीवन पर ध्यान केंद्रित कर सकते हैं और मेरे लिए मेरा भविष्य तय कर सकते हैं?”
उपरोक्त उद्धरण Reddit, एक सोशल मीडिया समाचार वेबसाइट और फोरम पर उपयोगकर्ताओं से लिए गए वास्तविक पोस्ट हैं, जहां उपयोगकर्ता सामग्री साझा कर सकते हैं या छोटे, रुचि-आधारित मंचों में “उपकारों” के रूप में जाना जाता है।
26 मानसिक स्वास्थ्य -संबंधित उपकारों, एमआईटी, न्यूयॉर्क विश्वविद्यालय (एनवाईयू) के शोधकर्ताओं, और मानसिक समानता और समग्र गुणवत्ता का मूल्यांकन करने में मदद करने के लिए एक संरचना, कैलिफोर्निया विश्वविद्यालय के 70,429 उत्तरों के साथ 12,513 पदों के डेटासेट का उपयोग करके लॉस एंजिल्स (यूसीएलए (यूसीएलए (यूसीएलए) )। उनका काम हाल ही में नेचुरल लैंग्वेज प्रोसेसिंग (EMNLP) में 2024 सम्मेलन में प्रकाशित हुआ था।
इसे पूरा करने के लिए, शोधकर्ताओं ने मानसिक स्वास्थ्य सहायता, दो लाइसेंस प्राप्त नैदानिक मनोविज्ञान की मांग करने वाले 50 यादृच्छिक नमूना रेडेट पोस्ट का मूल्यांकन करने के लिए कहा। यह जानने के बिना कि कौन से उत्तर वास्तविक थे या कौन से एआई-जनित, मानस को हर प्रतिक्रिया में सहानुभूति के स्तर का मूल्यांकन करने के लिए कहा गया था।
मानसिक स्वास्थ्य सहायता चैटबॉट्स को लंबे समय से मानसिक स्वास्थ्य सहायता की पहुंच में सुधार करने के लिए एक तरीके के रूप में खोजा गया है, लेकिन Openai के Chatgpt जैसे शक्तिशाली LLM मानव-AI इंटरैक्शन को बदल रहे हैं, जिसमें AI- जनित उत्तर वास्तविक आदमी के उत्तरों से भिन्न होते हैं।
इस महत्वपूर्ण प्रगति के बावजूद, एआई द्वारा प्रदान किए गए मानसिक स्वास्थ्य सहायता के अवांछित परिणामों ने इसके संभावित घातक जोखिमों की ओर इशारा किया है; पिछले साल मार्च में, एलिजा के साथ एक आदान-प्रदान के परिणामस्वरूप एक बेल्जियम के एक व्यक्ति की आत्महत्या से मृत्यु हो गई, जो कि जीपीटी-जे नामक एलएलएम के साथ एक मनोचिकित्सक की नकल करने के लिए एक चैटब ओट था। एक महीने बाद, नेशनल ईटिंग डिसऑर्डर एसोसिएशन अपने CHATB OT TS TESSA को स्थगित कर देगा, फिर CHATB OT TS खाने के विकारों के साथ रोगियों को डाइटिंग टिप्स देना शुरू कर दिया।
सादिया गेब्रियल, हाल ही में एक एमआईटी पोस्टडॉक, जो अब पहले यूसीएलए सहायक प्रोफेसर और पेपर के पहले लेखक हैं, ने स्वीकार किया कि शुरू में यह बहुत संदिग्ध है कि मानसिक स्वास्थ्य सहायता चैटबॉट वास्तव में कितना प्रभावी हो सकता है। गेब्रियल ने मशीन मशीन लर्निंग ग्रुप में पोस्टडॉक के रूप में उस समय के दौरान यह शोध किया, इलेक्ट्रिकल इंजीनियरिंग और कंप्यूटर विज्ञान विभाग के एमआईटी एसोसिएट प्रोफेसर, एमडीजिह गैसामी और एमआईटी। मशीन लर्निंग हेल्थ एंड कंप्यूटर और कंप्यूटर और आर्टिफिशियल इंटेलिजेंस लेबोरेटरी के लिए अब्दुल लतीफ जमील क्लिनिक।
गेब्रियल और शोधकर्ताओं की टीम ने पाया।
हालांकि, पूर्वाग्रह मूल्यांकन में, शोधकर्ताओं ने पाया कि जीपीटी -4 की प्रतिक्रिया सफेद पोस्टर या पोस्टर की तुलना में काले (2 से 15 प्रतिशत कम) और एशियाई पोस्टर (5 से 17 प्रतिशत कम) तक कम हो गई थी।
GPT-4 उत्तर और मानव उत्तरों में पूर्वाग्रह का मूल्यांकन करने के लिए, शोधकर्ताओं ने स्पष्ट जनसांख्यिकीय (जैसे, लिंग, दौड़) लीक और निहित जनसांख्यिकीय लीक के साथ विभिन्न प्रकार के पदों को शामिल किया है।
एक स्पष्ट जनसांख्यिकीय रिसाव ऐसा लगेगा: “मैं एक 32yo अश्वेत महिला हूँ।”
जब निहित जनसांख्यिकीय रिसाव ऐसा दिखता है: “मेरे प्राकृतिक बाल पहने एक 32yo लड़की होने के नाते”, जिसमें GPT -4 पर कुछ जनसांख्यिकीय को इंगित करने के लिए कीवर्ड का उपयोग किया जाता है।
अश्वेत महिला पोस्टरों के अपवाद के अलावा, GPT-4 के उत्तर मानव उत्तरदाताओं की तुलना में स्पष्ट और निहित जनसांख्यिकीय लीक से कम प्रभावित पाए गए, जिन्हें निहित जनसांख्यिकीय निर्देशों के साथ पदों का जवाब देते समय अधिक सहानुभूति माना जाता है।
“आपके द्वारा दिए गए इनपुट (एलएलएम) और संदर्भ के बारे में कुछ जानकारी, जैसे कि आप चाहते हैं (एलएलएम) एक चिकित्सक की शैली में काम करना, सोशल मीडिया पोस्ट की शैली का उपयोग करना, या रोगी की जनसांख्यिकीय सुविधाओं का उपयोग करना या नहीं, यह है, यह है प्रतिक्रिया पर एक बड़ा प्रभाव, “गेब्रियल कहते हैं।
पेपर बताता है कि स्पष्ट रूप से एलएलएम को जनसांख्यिकीय लक्षणों का उपयोग करने के लिए निर्देश देना प्रभावी रूप से पूर्वाग्रह को समाप्त कर सकता है, क्योंकि यह एकमात्र तरीका था जहां शोधकर्ताओं ने विभिन्न जनसांख्यिकीय समूहों में सहानुभूति में महत्वपूर्ण अंतर नहीं देखा।
गेब्रियल को उम्मीद है कि यह फ़ंक्शन नैदानिक सेटिंग्स में तैनात एलएलएमएस के जनसांख्यिकीय उप -समूहों के अधिक व्यापक और विचारशील मूल्यांकन को सुनिश्चित करने में मदद कर सकता है।
“एलएलएम का उपयोग पहले से ही रोगी सहायता प्रदान करने के लिए किया जा रहा है और चिकित्सा सेटिंग्स में तैनात किया गया है, कई मामलों में अक्षम मानव प्रणालियों को स्वचालित करने के लिए,” गैसमी कहते हैं। “यहां, हमने दिखाया है कि जब परिष्कृत एलएलएम पीयर-टू-पीयर मानसिक स्वास्थ्य सहायता आमतौर पर पुरुषों की तुलना में जनसांख्यिकीय रिसाव से कम होती है, तो वे एक अनुमानित रोगी के उप-समूहों में समान मानसिक स्वास्थ्य उत्तर प्रदान नहीं करते हैं … हम … हम … हम … मॉडल को बेहतर बनाने के कई अवसर हैं ताकि वे उपयोग किए जाने पर बेहतर समर्थन प्रदान करें। “