एलएलएम-आधारित मल्टी-एजेंट (एलएलएम-एमए) सिस्टम कई -लैंग्वेज मॉडल एजेंटों को जिम्मेदारियों को विभाजित करके जटिल कार्यों में सहयोग करने में सक्षम बनाते हैं। इन प्रणालियों का उपयोग रोबोटिक्स, वित्त और कोडिंग में किया जाता है, लेकिन संचार और शोधन में चुनौतियों का सामना करना पड़ता है। पाठ-आधारित संचार लंबे, असंरचित एक्सचेंजों की ओर जाता है, जिससे कार्यों को ट्रैक करना, संरचना बनाए रखना और पिछले इंटरैक्शन को याद रखना मुश्किल हो जाता है। बहस और प्रतिक्रिया आधारित अपडेट जैसे शोधन विधियों को प्रसंस्करण आदेशों के कारण महत्वपूर्ण इनपुट के रूप में अवहेलना या पक्षपाती किया जा सकता है। ये मुद्दे मल्टी-स्टेप समस्याओं को संभालने में एलएलएम-एमए सिस्टम की कार्यक्षमता को सीमित करते हैं।
वर्तमान में, एलएलएम-आधारित मल्टी-एजेंट सिस्टम का उपयोग करें बहस, आत्म-शरण, और बहु-चिकित्सा प्रतिक्रिया जटिल कार्यों को संभालने के लिए। ये तकनीकें पाठ-आधारित बातचीत के आधार पर नियंत्रण नहीं करती हैं और मुश्किल हो जाती हैं। एजेंट सबटास्क का पालन करने के लिए संघर्ष करते हैं, पिछली बातचीत को याद करने के लिए, और लगातार प्रतिक्रिया देने के लिए। चेन और ट्री -आधारित मॉडल सहित विभिन्न संचार संरचनाएं, दक्षता बढ़ाने का प्रयास करती हैं, लेकिन जानकारी के गठन के लिए एक स्पष्ट प्रोटोकॉल नहीं है। फीडबैक-रिफाइनमेंट तकनीक सटीकता बढ़ाने की कोशिश करती है, लेकिन पक्षपाती या डुप्लिकेट इनपुट के साथ चुनौतियां हैं, जिससे मूल्यांकन अविश्वसनीय हो जाता है। बड़े -स्केल व्यवस्थित संचार और प्रतिक्रिया के बिना, ऐसे सिस्टम अभी भी अक्षम हैं और गलतियों से भरे हुए हैं।
इन मुद्दों को कम करने के लिए, शोधकर्ता सोनी ग्रुप कॉर्पोरेशन, जापान, सूचित बात करनाएक संरचना जो संरचित प्रोटोकॉल और पदानुक्रमित शोधन का उपयोग करके मल्टी-एजेंट सिस्टम में संचार और कार्य समन्वय में सुधार करती है। मानक दृष्टिकोणों के विपरीत, बात करने वाला स्पष्ट रूप से एजेंटों और कार्य निर्माण की बातचीत का वर्णन करता है, त्रुटि और दक्षता को कम करता है। एजेंट औपचारिक चरण भूमिकाएं चलाते हैं, और स्केलिंग स्वचालित रूप से सिस्टम द्वारा विभिन्न मुद्दों के लिए अनुकूल हो जाती है, जिसके परिणामस्वरूप सुधार और समन्वय करने का निर्णय होता है।
यह ढांचा ग्राफ में एजेंटों को करता है कि प्रत्येक नोड एक एजेंट है, और किनारे संचार पथ का प्रतिनिधित्व करता है। एजेंटों के पास स्वतंत्र मेमोरी है, जो उन्हें लगातार जानकारी और साझा मेमोरी के उपयोग के बिना सूचित इनपुट के आधार पर निर्णय लेने की अनुमति देता है। संचार औपचारिक चित्र प्रक्रिया का अनुसरण करता है: संदेशों में सामग्री, पृष्ठभूमि की जानकारी और मध्यवर्ती आउटपुट शामिल हैं। एजेंटों को इस प्रक्रिया की निगरानी करने वाले पर्यवेक्षकों के साथ टीमों में व्यवस्थित किया जाता है, और एजेंटों का सबसेट सदस्यों और पर्यवेक्षकों के रूप में काम करता है, जिसके परिणामस्वरूप एक नेस्टेड पदानुक्रम होता है। सटीकता और त्रुटियों को कम करने के लक्ष्य के साथ, काम को आवंटित, मूल्यांकन किया जाता है, और गुणवत्ता की सीमा से गुजरने तक काम को दोहराने की एक सीमा में सुधार होता है।

मूल्यांकन पर, शोधकर्ताओं ने मूल्यांकन किया बात करना इसकी प्रभावशीलता का विश्लेषण करने के लिए कई बेंचमार्क में। पर मिम्लू डेटासेट, नैतिक परिदृश्य, कॉलेज लेज फिजिक्स, मशीन लर्निंग, औपचारिक पचरिक लॉजिक और अमेरिकी विदेश नीति, टॉकहियर, कवर जीपीटीकी उच्चतम सटीकता हासिल की 88.38%एजेंट ने कविता को पार कर लिया (83.66%) और एक एकल-एजेंट बेसलाइन की तरह प्रतिक्रिया–7@ (67.19%) और GPT-4O-7@ (71.15%)पदानुक्रमित शोधन के लाभों को व्यक्त करना। विकिक डेटासेट में, वह एक साथ उत्तर देते हुए, खुले डोमेन प्रश्न में बेसलाइन को पीछे छोड़ देता है गलीचा -1 स्कोर का 0.3461 (+5.32%) और एक गंदा का 0.6079 (+3.30%), चरम AUT टॉग्ड (0.3286 RUJ -1, 0.5885 बार्टस्कोर)। एबेलिकेशन अध्ययन से पता चला है कि मूल्यांकन पर्यवेक्षकों या संरचित संचार को हटाने से सटीकता में काफी कमी आई है, जिससे उनके महत्व की पुष्टि हुई है। समकालिक बलूत पास में 17.63% मानव मूल्यांकन विज्ञापन पाठ पीढ़ी के लिए कैमरा डेटासेट पर वफादारी, प्रवाह, आकर्षण और चरित्र की गिनती के उल्लंघन की ओर अपने बहु-आक्रामक आकलन को पहचानता है। समय ओपन-ओ 1 आंतरिक वास्तुकला का पता नहीं चला, टॉफियर ने प्रतिस्पर्धी MMLU स्कोर पोस्ट किए और निश्चित रूप से विकिक पर उन्हें हराया, जिसमें अधिकांश मतदान और काम और खुले स्रोत मल्टी-एजेंट सिस्टम पर प्रभुत्व के बीच विश्राम के साथ।


अंत में, प्रस्तावित संरचना ने संचार, तर्क और समन्वय में सुधार किया एलएलएम बहु-एजेंट सिस्टम पदानुक्रमित शोधन के साथ एक संरचित प्रोटोकॉल को मिलाकर, जिसके परिणामस्वरूप कई बेंचमार्क पर बेहतर प्रदर्शन हुआ। संदेश, मध्यवर्ती परिणाम और संदर्भ जानकारी सहित एक विषम एजेंट प्रतिक्रिया का त्याग किए बिना एक संरचित बातचीत की गारंटी। एक वृद्धि के साथ भी एपीआईपी लागत, बात करना एक स्केलेबल, ऑब्जेक्टिव मल्टी-एजेंट सहयोग के लिए एक नया बेंचमार्क सेट करें। यह विधि बाद के अनुसंधान में एक आधार रेखा के रूप में काम कर सकती है, कम लागत पर प्रभावी संचार विधियों और बहु-एजेंट इंटरैक्शन में सुधार कर सकती है, अंत में आगे बढ़ने की ओर बढ़ रही है। एल गांठदारआधारित सहकारी प्रणाली।
जाँच करना पेपर और GitHB पेज। इस शोध के लिए सभी श्रेय इस परियोजना के शोधकर्ताओं को जाते हैं। इसके अलावा, हमें फॉलो करने के लिए स्वतंत्र महसूस करें ट्विटर और हमसे जुड़ने के लिए मत भूलना 75 के+ एमएल सब्राडिट।
। अनुशंसित रीडिंग- एलजी एआई रिसर्च नेक्सस प्रकाशित करता है: एआई डेटासेट में कानूनी चिंताओं को खत्म करने के लिए एजेंट एआई सिस्टम और डेटा अनुपालन मानकों को एकीकृत करने वाला एक उन्नत प्रणाली

Divish मार्केटकपोस्ट में एक परामर्श इंटर्न है। वह खड़गपुर के एक भारतीय संगठन प्रौद्योगिकी एफ प्रौद्योगिकी से कृषि और खाद्य इंजीनियरिंग में BTech का पीछा कर रहे हैं। यह एक डेटा साइंस और मशीन लर्निंग उत्साही है जो इन प्रमुख तकनीकों को कृषि में एकीकृत करना चाहता है और चुनौतियों को हल करना चाहता है।
