स्मार्ट, वेब-मूल एआई एजेंटों की ओर एक कदम

अमेज़ॅन ने नोवा एक्ट पेश किया है, जो स्मार्ट एजेंटों के लिए एक इंजीनियर एआई मॉडल है जो वेब ब्राउज़रों में कार्य कर सकता है।

जबकि बड़े भाषा के मॉडल डेलो ने “एजेंटों” की अवधारणा को उन उपकरणों के रूप में लोकप्रिय बनाया, जो क्वेरीज़ का जवाब देते हैं या रिकवरी-एन गैंटेड जेनरेशन (आरएजी) जैसे तरीकों के माध्यम से जानकारी प्राप्त करते हैं, अमेज़ॅन कुछ मजबूत कल्पना करता है। कंपनी न केवल विभिन्न डिजिटल और भौतिक वातावरणों में मूर्त, बहु-चरणीय कार्यों को करने में सक्षम संगठनों के रूप में परिभाषित करती है।

“हमारा सपना उन एजेंटों के लिए है जिनके पास व्यापक, जटिल, बहु-चरणीय कार्य हैं जैसे कि शादियों का आयोजन करना या व्यावसायिक उत्पादकता बढ़ाने के लिए जटिल आईटी कार्यों को संभालना,” अमेज़ॅन ने कहा।

वर्तमान बाजार में आने वाले लोग अक्सर कम हो जाते हैं, कई एजेंट लगातार मानव पर्यवेक्षण पर निर्भर करते हैं और उनकी दक्षता के साथ व्यापक एपीआई एकीकरण – जो सभी कार्यों के लिए संभव नहीं है। नोवा अधिनियम इन सीमाओं के लिए अमेज़ॅन का जवाब है।

https://www.youtube.com/watch?v=jllapxwmalu

मॉडल के साथ, अमेज़ॅन अमेज़ॅन नोवा अधिनियम एसडीके के अनुसंधान पूर्वावलोकन को जारी करता है। एसडीके का उपयोग करते हुए, डेवलपर्स वेब कार्यों को स्वचालित करने में सक्षम एजेंट बना सकते हैं जैसे कि Eginolutions fiss के बाहर निर्देश प्रस्तुत करना, अनुसूचित कैलेंडर होल्ड को सक्षम करना या स्वचालित ईमेल उत्तरों को सक्षम करना।

एसडीके का उद्देश्य जटिल वर्कफ़्लो को एक विश्वसनीय “परमाणु कमांड” में तोड़ना है जैसे कि खोज, जांच या विशेष इंटरफ़ेस तत्वों जैसे ड्रॉपडाउन या पॉप पिल्स के साथ संवाद करना। इन कमांड को बेहतर बनाने के लिए विस्तृत निर्देश जोड़े जा सकते हैं, डेवलपर्स को एक चेकआउट के दौरान एक एजेंट को बीमा अपसेल को बायपास करने का निर्देश देते हैं।

सटीकता को और बढ़ाने के लिए, एसडीके एक नाटककार द्वारा ब्राउज़र हेरफेर का समर्थन करता है, एपीआई एलएस, पायथन एकीकरण और लोड देरी को खत्म करने के लिए समानांतर थ्रेडिंग कहता है।

नोवा एक्ट: बेंचमार्क पर असाधारण प्रदर्शनी

जटिल कार्यों पर मिडलिंग सटीकता दिखाने वाले अन्य जेनेरिक मॉडल के विपरीत, नोवा अधिनियम विश्वसनीयता पसंद करता है। अमेज़ॅन कुछ क्षमताओं के लिए आंतरिक मूल्यांकन पर अपने मॉडल के प्रभावशाली स्कोर के 90% से अधिक पर प्रकाश डालता है जो आमतौर पर प्रतियोगियों को चुनौती देते हैं।

नोवा अधिनियम ने स्क्रीनस्पॉट वेब टेक्स्ट बेंचमार्क पर निकटतम 0.939 हासिल किया, जो फ़ॉन्ट आकार को समायोजित करने जैसे पाठ-आधारित इंटरैक्शन के लिए प्राकृतिक भाषा निर्देशों को मापता है। क्लाउड 3.7 सॉनेट (0.900) और Openai के CUA (0.883) जैसे प्रतिस्पर्धी मॉडल में महत्वपूर्ण मार्जिन की कमी है।

इसी तरह, नोवा एक्ट ने स्क्रीनपॉट वेब आइकन बेंचमार्क में 0.879 स्कोर किया, जो रेटिंग स्टार्स या आइकन जैसे दृश्य तत्वों के साथ बातचीत का परीक्षण करता है। जबकि ग्राउंडुई वेब टेस्ट, जिसे विभिन्न उपयोगकर्ता इंटरफ़ेस तत्वों को नेविगेट करने में एआई की महारत का आकलन करने के लिए डिज़ाइन किया गया है, ने नोवा अधिनियम को प्रतियोगियों को थोड़ा दिखाया, अमेज़ॅन इसे मॉडल में सुधार के क्षेत्र के रूप में देखता है।

अमेज़ॅन व्यावहारिक विश्वसनीयता प्रदान करने पर अपना ध्यान केंद्रित करता है। एक बार एक एजेंट नोवा एक्ट फ़ंक्शन का उपयोग करके बनाया जाता है, डेवलपर्स मुख्य रूप से इसे तैनात कर सकते हैं, इसे एपीआई के रूप में एकीकृत कर सकते हैं, या इसे एसिमेरिक कार्यों को करने के लिए शेड्यूल कर सकते हैं। एक दिखाए गए उपयोग के मामले में, एजेंट स्वचालित रूप से हर मंगलवार शाम को डिलीवरी के लिए सलाद का आदेश देता है, जो चल रहे उपयोगकर्ता हस्तक्षेप की आवश्यकता के बिना होता है।

https://www.youtube.com/watch?v=65GITQW0VC8

अमेज़ॅन स्केलेबल और स्मार्ट एआई एजेंटों के लिए अपनी दृष्टि निर्धारित करता है

नोवा एक्ट की स्टैंडआउट सुविधाओं में से एक अपने उपयोगकर्ता इंटरफ़ेस को कम से कम अतिरिक्त प्रशिक्षण के साथ एक नए वातावरण में स्थानांतरित करने की क्षमता है। अमेज़ॅन ने एक उदाहरण साझा किया है जहां नोवा एक्ट ब्राउज़र-आधारित खेलों में सराहनीय प्रदर्शन करता है, हालांकि उनके प्रशिक्षण में वीडियो गेम के अनुभव शामिल नहीं थे। ये अनुकूलनशीलता स्थिति विभिन्न अनुप्रयोगों के लिए एक बहुमुखी एजेंट के रूप में कार्य करती है।

इस क्षमता को पहले से ही अमेज़ॅन के अपने पारिस्थितिकी तंत्र में लाभान्वित किया जा रहा है। अलेक्सा+में, नोवा अधिनियम उपयोगकर्ताओं के लिए कार्यों को पूरा करने के लिए स्व-निर्देशित वेब नेविगेशन को सक्षम बनाता है, भले ही एपीआई एक्सेस उपकर व्यापक न हो। यह स्मार्ट एआई सहायकों की ओर एक कदम प्रस्तुत करता है जो स्वतंत्र रूप से काम कर सकते हैं, अपने कौशल का अधिक गतिशील रूप से उपयोग कर सकते हैं।

https://www.youtube.com/watch?v=edduujz5jue

अमेज़ॅन स्पष्ट है कि नोवा अधिनियम एक अधिक जटिल बनाने के एक व्यापक मिशन के पहले चरण का प्रतिनिधित्व करता है, जो मल्टी-स्टेप फ़ंक्शन, बुद्धिमान, विश्वसनीय एआई एजेंटों को संभालने में सक्षम है।

सरल सुझावों से आगे बढ़ते हुए, अमेज़ॅन का ध्यान एक सुचारू प्रदर्शन के बजाय विभिन्न, वास्तविक दुनिया के परिदृश्यों में सुदृढीकरण शिक्षा के माध्यम से प्रशिक्षण एजेंटों पर है। यह मूल मॉडल डेल नोवा मॉडल के लिए लंबे समय तक प्रशिक्षण पाठ्यक्रम में एक चेकपॉइंट के रूप में कार्य करता है, जो एआई एजेंट परिदृश्य को फिर से आकार देने के लिए कंपनी की महत्वाकांक्षा को दर्शाता है।

अमेज़ॅन ने कहा, “एजेंटों के लिए सबसे मूल्यवान उपयोग के मामले अभी तक बनाए गए हैं।” “सर्वश्रेष्ठ डेवलपर्स और डिजाइनर उन्हें ढूंढते हैं। हमारे नोवा एक्ट एसडीके का यह शोध पूर्वावलोकन हमें तेजी से प्रोटोटाइपिंग और बार -बार प्रतिक्रिया के माध्यम से इन बिल्डरों के साथ दोहराने में सक्षम बनाता है।”

नोवा अधिनियम एआई एजेंटों को जटिल, डिजिटल कार्यों के लिए वास्तव में उपयोगी बनाने की दिशा में एक कदम है। पुनर्विचार से लेकर विश्वसनीयता पर जोर देने के लिए, बेंचमार्क से लेकर विश्वसनीयता तक, इसका डिज़ाइन डेवलपर्स के सशक्तिकरण के आसपास केंद्रित है, जो वर्तमान वेतन पीढ़ी के उपकरणों से परे संभव है।

यह भी देखें: एंथ्रोपिक क्लाउड के ‘एआई जीव विज्ञान’ में अंतर्दृष्टि प्रदान करता है

उद्योग के नेताओं से एआई और बड़े डेटा के बारे में अधिक जानना चाहते हैं? एम्स्टर्डम, कैलिफोर्निया और लंदन में आयोजित एआई और बिग डेटा एक्सपो की जाँच करें। ब्रॉड इवेंट को इंटेलिजेंट ऑटो टोमेशन कॉन्फ्रेंस, ब्लॉकएक्स, डिजिटल ट्रांसफॉर्मेशन वीक और साइबर सिक्योरिटी एंड क्लाउड एक्सपो सहित अन्य प्रमुख घटनाओं के साथ सह-स्थित किया गया है।

TechFire द्वारा संचालित अन्य आगामी उद्यम प्रौद्योगिकी घटनाओं और वेबिनार का अन्वेषण करें।

Scroll to Top