रोबोटिक सहायक गलतियाँ? बस इसे सही दिशा में देखें मीट न्यूज

कल्पना कीजिए कि रोबोट आपको व्यंजन साफ ​​करने में मदद करता है। आप उसे सिंक से साबुन के साथ एक कटोरा पकड़ने के लिए कहते हैं, लेकिन उसका ग्रिपर थोड़ा याद करता है।

MIT और NVIDI शोधकर्ताओं द्वारा विकसित एक नए ढांचे का उपयोग करके, आप साधारण इंटरैक्शन के साथ उस रोबोट के व्यवहार में सुधार कर सकते हैं। विधि आपको कटोरे को इंगित कर सकती है या स्क्रीन के लिए एक रास्ता खोज सकती है, या बस रोबोट का हाथ सही दिशा में देती है।

रोबोट व्यवहार में सुधार के अन्य तरीकों के विपरीत, इस तकनीक को उपयोगकर्ताओं को नए डेटा एकत्र करने और मशीन-लर्निंग मॉडल को फिर से व्यवस्थित करने की आवश्यकता नहीं होती है जो रोबोट के मस्तिष्क को मजबूत करता है। यह रोबोट को एक सहज, वास्तविक समय मानव प्रतिक्रिया का उपयोग करने में सक्षम बनाता है, जो एक संभावित एक्शन अनुक्रम का चयन करने के लिए होता है जो उपयोगकर्ता के उद्देश्य को पूरा करने के लिए जितना संभव हो उतना करीब आता है।

जब शोधकर्ताओं ने अपनी संरचना का परीक्षण किया, तो उनकी सफलता दर वैकल्पिक विधि से 21 प्रतिशत अधिक थी, जिसने मानवीय हस्तक्षेप का लाभ नहीं उठाया।

लंबे समय में, यह संरचना उपयोगकर्ता को घरेलू कार्यों को करने के लिए कारखाने-प्रशिक्षित रोबोट को अधिक आसानी से करने के लिए अधिक आसानी से मार्गदर्शन कर सकती है, हालांकि रोबोट ने अपने घर या वस्तुओं को कभी नहीं देखा है।

“हम लैपल डेटा स्टोर करने और तंत्रिका नेटवर्क मॉडल को समाप्त करने की उम्मीद नहीं कर सकते। उपभोक्ता को उम्मीद होगी कि रोबोट सीएस के बाहर काम करे, और यदि ऐसा नहीं होता है, तो वे इसे अनुकूलित करने के लिए एक सहज ज्ञान युक्त विधि की कामना करेंगे। फेलिक्स यानवी वांग, इलेक्ट्रिकल इंजीनियरिंग और कंप्यूटर साइंस (ईईसी) के स्नातक छात्र और इस पद्धति पर एक पेपर के लेखक।

इसके सह-लेखकों में लिरुई वांग पीएचडी ’24 और यिलुन डु पीएचडी ’24 शामिल हैं; वरिष्ठ लेखक जूली शाह, एरोनॉटिक्स और एस्ट्रोनॉट एमआईटी प्रोफेसर और कंप्यूटर विज्ञान और कृत्रिम खुफिया प्रयोगशाला (CSAL) में इंटरएक्टिव रोबोटिक्स समूह के निदेशक; साथ ही बालकुमार सुंदरिंगम, ज़ुनिंग यांग, यू-वेई चाओ, क्लाउडिया पेरेज़-डारपिनो पीएचडी ’19, और एनवीडिया डाइटर फॉक्स। रोबोट और स्वचालन पर अंतर्राष्ट्रीय सम्मेलन में अनुसंधान प्रस्तुत किया जाएगा।

दोष

हाल ही में, शोधकर्ताओं ने “नीति” या नियमों के सेट को सीखने के लिए पूर्व-प्रशिक्षित जेनेरिक एआई मॉडल का उपयोग करना शुरू कर दिया है, जो रोबोट कार्रवाई को पूरा करने के लिए हैं। जनरेटिव मॉडल कई जटिल कार्यों को हल कर सकते हैं।

प्रशिक्षण के दौरान, मॉडल केवल संभावित रोबोट गति को देखता है, इसलिए यह रोबोट का पालन करने के लिए एक वैध तरीका बनाना सीखता है।

जबकि यह मार्ग मान्य है, इसका मतलब यह नहीं है कि वे हमेशा वास्तविक दुनिया में उपयोगकर्ता के उद्देश्य को व्यवस्थित करते हैं। रोबोट को शेल्फ को खटखटाने के बिना बी बॉक्स केटी को पकड़ने के लिए प्रशिक्षित किया गया हो सकता है, लेकिन अगर शेल्फ प्रशिक्षण में जो कुछ भी आप देखते हैं, उससे अलग है, तो यह किसी के बुकशेल्फ़ के शीर्ष पर बी बॉक्स तक पहुंचने में विफल हो सकता है।

इन विफलताओं को दूर करने के लिए, इंजीनियर आमतौर पर नए काम दिखाते हुए डेटा एकत्र करते हैं और जनरेटिंग मॉडल को फिर से प्रशिक्षित करते हैं, एक महंगी और समय लेने वाली प्रक्रिया जिसमें मशीन-लर्निंग कौशल की आवश्यकता होती है।

इसके बजाय, MIT शोधकर्ता उपयोगकर्ताओं को एक गलती करते समय तैनाती के दौरान एक रोबोट के व्यवहार को चलाने की अनुमति देना चाहते हैं।

लेकिन अगर कोई मानव अपने व्यवहार को बेहतर बनाने के लिए रोबोट के साथ बातचीत करता है, तो वह अनजाने में उत्पन्न मॉडल के लिए एक अमान्य कार्रवाई का चयन कर सकता है। वह बी बॉक्स एक्स तक पहुंच सकता है जो वह उपयोगकर्ता चाहता है, लेकिन इस प्रक्रिया में शेल्फ किताबों को हरा देता है।

“हम उपयोगकर्ता को उस तरह की त्रुटियों को प्रस्तुत किए बिना रोबोट से संपर्क करने की अनुमति देना चाहते हैं,” इसलिए हमें एक ऐसा व्यवहार मिलता है जो तैनाती के दौरान उपयोगकर्ता के उद्देश्य के साथ अधिक संरेखित होता है, लेकिन यह मान्य और संभव है, “वांग कहते हैं।

उनकी संरचना रोबोट के व्यवहार को बेहतर बनाने के लिए तीन सहज तरीके प्रदान करके इसे पूरा करती है, जिनमें से प्रत्येक कुछ लाभ देता है।

सबसे पहले, उपयोगकर्ता उस ऑब्जेक्ट को इंगित कर सकता है कि वे रोबोट को उस इंटरफ़ेस में हेरफेर करना चाहते हैं जो उसके कैमरे का दृश्य दिखाता है। दूसरा, वे उस इंटरफ़ेस में एक रास्ता खोज सकते हैं, जिससे वे स्पष्ट हो सकते हैं कि रोबोट बजट तक कैसे पहुंचना चाहता है। तीसरा, वे रोबोट के हाथ को उस दिशा में स्थानांतरित कर सकते हैं जो वे इसका पालन करते हैं।

“जब आप 3 डी स्पेस में कार्यों के लिए पर्यावरण की 2 डी छवि को मैप कर रहे हैं, तो कुछ जानकारी खो जाती है। वांग कहते हैं, किसी भी जानकारी को शारीरिक रूप से खोए बिना उपयोगकर्ता के उद्देश्य को निर्दिष्ट करने का सबसे प्रत्यक्ष तरीका, वांग कहते हैं।

सफलता के लिए नमूना

इन इंटरैक्शन को सुनिश्चित करने के लिए, रोबोट एक अमान्य कार्रवाई का कारण नहीं बनता है जैसे कि अन्य वस्तुओं से चिपके रहना, शोधकर्ता एक विशिष्ट नमूना प्रक्रिया का उपयोग करते हैं। यह तकनीक मॉडल को वैध क्रियाओं के एक सेट से कार्रवाई का चयन करने की अनुमति देती है जो उपयोगकर्ता के लक्ष्य के साथ बहुत निकटता से समायोजित करता है।

वांग बताते हैं, “उपयोगकर्ता की इच्छा को लागू करने के बजाय, हम रोबोट को यह अंदाजा देते हैं कि उपयोगकर्ता क्या इरादा रखता है, लेकिन नमूना प्रक्रिया को अपने स्वयं के सीखे हुए व्यवहारों के सेट के चारों ओर दोलन करने दें।”

इस नमूना विधि ने शोधकर्ताओं की संरचना को टॉय किचन में वास्तविक रोबोट हाथों के साथ सिमुलेशन और प्रयोगों के दौरान तुलना करने के अन्य तरीकों को पूरा करने के लिए सक्षम किया।

हालांकि उनकी विधि हमेशा कार्य को तुरंत पूरा नहीं कर सकती है, यह उपयोगकर्ताओं को रोबोट की मरम्मत करने में सक्षम होने का लाभ देता है यदि वे कुछ गलत करते हैं, इसके बजाय इंतजार करने के लिए इंतजार कर रहे हैं और फिर इसे नए निर्देश दें।

इसके अलावा, उपयोगकर्ता द्वारा रोबोट को थोड़ी देर के लिए नग्न होने के बाद, यह सुधारात्मक कार्रवाई में लॉग इन कर सकता है और भविष्य के प्रशिक्षण के माध्यम से इसे अपने व्यवहार में समायोजित कर सकता है। उसके बाद, अगले दिन, रोबोट एक नाज़ की आवश्यकता के बिना सही कटोरे का चयन कर सकता है।

“लेकिन यह उपयोगकर्ता के लिए रोबोट के साथ संवाद करने का तरीका है, जो हमने यहां दिखाया है,” वांग कहते हैं।

भविष्य में, शोधकर्ता अपने प्रभाव को बनाए रखते या सुधारते हुए नमूना प्रक्रिया की गति को बढ़ाना चाहते हैं। वह एक उपन्यास वातावरण में एक रोबोट नीति पीढ़ी के साथ प्रयोग करना चाहता है।

Scroll to Top