सिमुलर प्रकाशित एजेंट S2: कंप्यूटर उपयोग एजेंटों के लिए ओपन, मॉड्यूलर और स्केलेबल एआई फ्रेमवर्क

आज के डिजिटल परिदृश्य में, विभिन्न प्रकार के सॉफ़्टवेयर FTWare और ऑपरेटिंग नेटिंग सिस्टम के साथ संवाद करना अक्सर एक उबाऊ और गलत अनुभव हो सकता है। कई उपयोगकर्ताओं को जटिल इंटरफेस द्वारा नेविगेट करने और सटीक और अनुकूलनशीलता की मांग करने वाले नियमित कार्यों को करने पर चुनौतियों का सामना करना पड़ता है। मौजूदा स्वचालन उपकरण अक्सर सूक्ष्म इंटरफ़ेस परिवर्तनों के अनुकूल होने के लिए कम हो जाते हैं या पिछली त्रुटियों से सीखते हैं, उपयोगकर्ताओं को उस प्रक्रिया की मैन्युअल रूप से निगरानी करने के लिए छोड़ देते हैं जो अन्यथा छंटनी की जा सकती है। उपयोगकर्ता की अपेक्षाओं और पारंपरिक स्वचालन की क्षमताओं के बीच यह निरंतर दूरी उस प्रणाली के लिए कहती है जो न केवल मज़बूती से काम करती है, बल्कि समय के साथ सीखती है और समायोजित करती है।

सिमुलर ने एजेंट एस 2, एक खुला, मॉड्यूलर और स्केलेबल फ्रेमवर्क पेश किया है, जो कंप्यूटर का उपयोग एजेंटों में मदद करने के लिए डिज़ाइन किया गया है। एजेंट S2 अपने पूर्ववर्ती द्वारा निर्धारित आधार पर बनाता है, कंप्यूटर और स्मार्टफोन पर स्वचालित कार्यों के लिए एक शुद्ध दृष्टिकोण प्रदान करता है। फ्रेमवर्क विभिन्न डिजिटल वातावरणों के अनुकूल हो सकता है, सामान्य उद्देश्य और विशिष्ट मॉडल दोनों के साथ मॉड्यूलर डिजाइन का संयोजन कर सकता है। इसका डिजाइन मानव मस्तिष्क की प्राकृतिक मॉड्यूलरिटी से प्रेरित है, जहां विभिन्न क्षेत्र जटिल कार्यों को संभालने के लिए सामंजस्यपूर्ण तरीके से काम करते हैं, लचीले और मजबूत दोनों को बढ़ावा देने वाली एक प्रणाली है।

तकनीकी विवरण और लाभ

अपने मुख्य भाग में, एजेंट S2 अनुभव-द-पदानुक्रमित पदानुक्रमित योजना को नियुक्त करता है। इस विधि में एक छोटे, अधिक प्रबंधित उप -क्षेत्रों में लंबे और जटिल कार्यों को तोड़ना शामिल है। फ्रेमवर्क पिछले अनुभवों से सीखकर अपनी रणनीति जारी रखता है, जहां समय के साथ बेहतर होता है। एजेंट एस 2 का एक महत्वपूर्ण पहलू इसकी दृश्य ग्राउंडिंग क्षमता है, जो इसे ग्राफिकल यूजर इंटरफेस के साथ एक विशिष्ट बातचीत के लिए कच्चे स्क्रीनशॉट की व्याख्या करने की अनुमति देता है। यह अतिरिक्त संरचित डेटा की आवश्यकता को समाप्त करता है और यूआई तत्वों को ठीक से पहचानने और संपर्क करने के लिए सिस्टम की क्षमता को बढ़ाता है। इसके अलावा, एजेंट S2 एक उन्नत एजेंट-कंप्यूटर इंटरफ़ेस का उपयोग करता है जो विशेषज्ञ मॉड्यूल को नियमित, निम्न-स्तरीय क्रियाएं प्रदान करता है। अनुकूली मेमोरी तंत्र के माध्यम से पूरक, सिस्टम भविष्य के निर्णय लेने को निर्देशित करने के लिए उपयोगी अनुभवों को बनाए रखता है, जिसके परिणामस्वरूप अधिक मापा और प्रभावी प्रदर्शन होता है।

परिणाम और अंतर्दृष्टि

वास्तविक दुनिया के बेंचमार्क पर मूल्यांकन इंगित करता है कि एजेंट S2 कंप्यूटर और स्मार्टफोन दोनों में मज़बूती से करता है। OSWLD बेंचमार्क पर, जो परीक्षण करता है कि मल्टी-स्टेप कंप्यूटर फ़ंक्शंस-एजेंट S2 के निष्पादन ने 50-चरण मूल्यांकन पर 34.5% की सफलता दर हासिल की, जो पिछले मॉडल में सामान्य अभी तक प्रासंगिक प्रतिबिंब को दर्शाता है। इसी तरह, AndroidWorld बेंचमार्क पर, स्मार्टफोन कार्यों में रूपरेखा 50% सफलता दर तक पहुंच गई। ये परिणाम सिस्टम के व्यावहारिक लाभों को दिखाते हैं जो आगे की योजना बना सकते हैं और गतिशील परिस्थितियों के अनुकूल हो सकते हैं, यह सुनिश्चित करते हुए कि कार्यों को बेहतर सटीकता और न्यूनतम मैनुअल हस्तक्षेप के साथ पूरा किया जाता है।

अंत

एजेंट S2 दैनिक डिजिटल इंटरैक्शन को बढ़ाने के लिए एक विचारशील दृष्टिकोण का प्रतिनिधित्व करता है। मॉड्यूलर डिज़ाइन और अनुकूली शिक्षा के माध्यम से कंप्यूटर ऑटो टमाटर में सामान्य चुनौतियों को संबोधित करके, फ्रेमवर्क अधिक प्रभावी ढंग से नियमित कार्यों का प्रबंधन करने के लिए एक व्यावहारिक निपटान प्रदान करता है। इसकी सक्रिय योजना, दृश्य समझ और विशेषज्ञ प्रतिनिधिमंडल का एक संतुलित संयोजन इसे जटिल कंप्यूटर कार्यों और मोबाइल अनुप्रयोगों दोनों के लिए उपयुक्त बनाता है। एक ऐसे युग में जहां डिजिटल वर्कफ़्लो का विकास जारी है, एजेंट दैनिक दिनचर्या में स्वचालन को एकीकृत करने का एक मापा, विश्वसनीय माध्यम प्रदान करता है – मैनुअल निरीक्षण की आवश्यकता को कम करते समय उपयोगकर्ताओं के लिए बेहतर परिणाम प्राप्त करता है।


जाँच करना तकनीकी विवरण और GitHub पृष्ठ। इस शोध के लिए सभी श्रेय इस परियोजना के शोधकर्ताओं को जाते हैं। इसके अलावा, हमें फॉलो करने के लिए स्वतंत्र महसूस करें ट्विटर और हमसे जुड़ने के लिए मत भूलना 80K+ एमएल सबमिटेड

MEET PALLANT: व्यवहार दिशानिर्देशों और रनटाइम मॉनिटरिंग का उपयोग करके, अपने AI ग्राहक सेवा एजेंटों पर आवश्यक नियंत्रण और सटीकता प्रदान करने के लिए AI फ्रेमवर्क डेवलपर्स को प्रदान करने के लिए एक LLM-FIRST वार्तालाप किया गया है। 🔧 🔧 🎛 इसका उपयोग करना आसान है। और पायथन और टाइपस्क्रिप्ट में मूल ग्राहक एसडीके का उपयोग करके संचालित है।


ASIF Razzaq एक दूरदर्शी उद्यमी और इंजीनियर के रूप में मार्केटएकपोस्ट मीडिया इंक के सीईओ हैं, ASIF सामाजिक अच्छे के लिए कृत्रिम बुद्धिमत्ता की संभावना को बढ़ाने के लिए प्रतिबद्ध है। उनका सबसे हालिया प्रयास आर्टिफिशियल इंटेलिजेंस मीडिया प्लेटफॉर्म, मार्कटेकपोस्ट का उद्घाटन है, जो मशीन लर्निंग की गहराई के लिए और कवरेज की गहराई के लिए गहरी सीखने की खबर के लिए है। यह तकनीकी रूप से ध्वनि है और एक बड़े दर्शकों द्वारा आसानी से समझ में आता है। प्लेटफ़ॉर्म में 2 मिलियन से अधिक मासिक दृश्य हैं, जो दर्शकों के बीच अपनी लोकप्रियता दिखाते हैं।

पार्लेंट: LLMS (B ED) के साथ एक विश्वसनीय AI ग्राहक का सामना करना

Scroll to Top