ए-एमईएम फ्रेमवर्क शक्तिशाली लंबी संदर्भ मेमोरी का समर्थन कैसे करता है ताकि एलएलएम अधिक जटिल कार्य ले सकें


नवीनतम अपडेट और प्रमुख एआई कवरेज पर विशिष्ट सामग्री के लिए हमारे दैनिक और साप्ताहिक समाचार पत्र में शामिल हों। और अधिक जानें


रटर्स यूनिवर्सिटी, एंट ग्रुप और सेल्सफोर्स रिसर्च के शोधकर्ताओं ने एक नई संरचना का सुझाव दिया है जो एआई एजेंटों को अपने वातावरण से जानकारी को एकीकृत करके और जटिल संरचनाओं को विकसित करने के लिए स्वचालित रूप से संलग्न यादें बनाने में अधिक जटिल कार्यों को करने में सक्षम बनाता है।

ए-एमईएम कहा जाता है, फ्रेमवर्क एजेंट की बातचीत से उपयोगी जानकारी मेमोरी अभ्यावेदन बनाने और मेमोरी अभ्यावेदन बनाने के लिए बड़े भाषा मॉडल (एलएलएम) और वेक्टर एम्बेडिंग का उपयोग करती है जो प्रभावी ढंग से प्राप्त और उपयोग किए जा सकते हैं। उद्यम अपने वर्कफ़्लोज़ और अनुप्रयोगों में एकीकृत करने के लिए एआई एजेंटों की तलाश कर रहा है, एक विश्वसनीय मेमोरी प्रबंधन प्रणाली होने से एक बड़ा अंतर हो सकता है।

एलएलएम मेमोरी क्यों महत्वपूर्ण है

एलएलएम और एजेंटों में मेमोरी महत्वपूर्ण है क्योंकि यह टूल और उपयोगकर्ताओं के बीच लंबे समय तक बातचीत को सक्षम करता है। वर्तमान मेमोरी सिस्टम, हालांकि, या तो अनुचित हैं या एक पूर्वनिर्धारित स्कीमा पर आधारित हैं जो अनुप्रयोग की बदलती प्रकृति और उनके सामने आने वाली बातचीत को फिट नहीं कर सकते हैं।

शोधकर्ताओं ने लिखा, “इस तरह के कठोर प्रारूप, फिक्स्ड एजेंट वर्कफ़्लो के साथ मिलकर, इन प्रणालियों की क्षमता को गंभीरता से सीमित करते हैं और लंबी -लंबी बातचीत में प्रभावशीलता को बनाए रखने के लिए।” “चुनौती अधिक से अधिक जटिल हो जाती है क्योंकि एलएलएम एजेंट अधिक जटिल, ओपन -ेंड कार्यों का सामना करते हैं, जहां लचीले ग्नोलेज की आवश्यकता होती है और निरंतर अनुकूलन होता है।”

ए-मेम ने समझाया

ए-मेमोरी एक एजेंसी मेमोरी आर्किटेक्चर का परिचय देता है जो शोधकर्ताओं के अनुसार, एलएलएम एजेंटों के लिए स्वायत्त और लचीली मेमोरी प्रबंधन को सक्षम बनाता है।

हर बार एक एलएलएम एजेंट अपने वातावरण के साथ बातचीत करता है-भले ही वह उपकरणों का उत्पादन करता है या उपयोगकर्ताओं के साथ संदेशों को अपग्रेड करता है, स्पष्ट जानकारी और मेटाडेटा का उत्पादन करता है, जैसे समय, संदर्भ विवरण, प्रासंगिक कीवर्ड और लिंक की गई यादें। कुछ विवरण एलएलएम द्वारा निर्मित किए जाते हैं क्योंकि यह बातचीत की जांच करता है और शब्दार्थ घटकों को बनाता है।

एक बार मेमोरी बन जाने के बाद, एनकोडर मॉडल का उपयोग इसके सभी घटकों के एम्बेडिंग मूल्य की गणना करने के लिए किया जाता है। एलएलएम-जनित सिमेंटिक घटकों और एम्बेडिंग का संयोजन मानव-लाइफेस्टेबल संदर्भ और समानता का पता लगाने दोनों द्वारा कुशल वसूली के लिए एक उपकरण प्रदान करता है।

स्मृति बनाओ

ए-एमईएम ढांचे के दिलचस्प तत्वों में से एक पूर्वनिर्धारित नियमों की आवश्यकता के बिना विभिन्न मेमोरी नोटों को संलग्न करने की विधि है। प्रत्येक नए मेमोरी नोट के लिए, ए-एमईएम उनके एम्बेडिंग मूल्यों की समानता के आधार पर करीबी यादों को पहचानता है। LLM तब RE -RI के उम्मीदवारों को प्राप्त करने वाले उम्मीदवारों की पूरी सामग्री का विश्लेषण करता है, यह चुनने के लिए कि नई मेमोरी से जुड़ने के लिए सबसे उपयुक्त क्या है।

शोधकर्ताओं ने लिखा, “एक प्रारंभिक फिल्टर के रूप में एक एम्बेडिंग-आधारित पुनर्वितरण खरीद का उपयोग करके, हम सार्थक स्थिरता बनाए रखने के लिए कुशल स्केलेबिलिटी को सक्षम करते हैं।” “ए-मेमोरी पूरी तुलना के बिना बड़े मेमोरी स्टोरेज में भी संभावित कनेक्शनों की पहचान कर सकता है। इससे भी महत्वपूर्ण बात यह है कि एलएलएम-संचालित विश्लेषण उन रिश्तों की एक नूनन्ट समझ के लिए अनुमति देता है जो सरल समानता मैट्रिक्स से आगे बढ़ते हैं। “

नई मेमोरी के लिए लिंक बनाने के बाद, ए-एमईएम उन यादों को अपडेट करता है जो उन्होंने अपनी पाठ्य जानकारी और नई मेमोरी के साथ संबंधों के आधार पर की हैं। समय के साथ अधिक यादें जोड़ी जाती हैं, यह प्रक्रिया सिस्टम के सिस्टम के जुनेवेल्ट को बेहतर बनाती है, जिससे यादों में उच्च रैंक पैटर्न और अवधारणाओं की खोज को सक्षम किया जाता है।

प्रत्येक इंटरैक्शन में, ए-एमईएम एजेंट के प्रासंगिक इतिहास प्रदान करने के लिए संदर्भ-जागरूक मेमोरी रिकवरी के अधिग्रहण का उपयोग करता है। एक नए प्रॉम्प्ट को देखते हुए, ए-मेमोरी पहले मेमोरी नोट्स के लिए उपयोग की जाने वाली उसी विधि के साथ अपने एम्बेडिंग मूल्य की गणना करता है। सिस्टम इस एम्बेडिंग का उपयोग मेमोरी स्टोर से सबसे सुसंगत यादों को प्राप्त करने और संदर्भित जानकारी के साथ मूल संकेत को बढ़ाने के लिए करता है जो एजेंट को वर्तमान बातचीत को बेहतर ढंग से समझने और प्रतिक्रिया देने में मदद करता है।

शोधकर्ताओं ने लिखा, “रेड री ने प्रासंगिक अतीत के अनुभवों के साथ वर्तमान बातचीत को जोड़कर एजेंट की लॉजिक प्रक्रिया को समृद्ध किया और जुनोवलेज सिस्टम के साथ वर्तमान बातचीत को समृद्ध किया।”

समारोह

शोधकर्ताओं ने कई सत्रों को फैलाते हुए, बहुत लंबी बातचीत डेटासेट पर ए-एमईएम का परीक्षण किया। लोगों में बहु-हॉप प्रश्न जैसे चुनौतीपूर्ण कार्य शामिल हैं, जिन्हें कई चैट सत्रों और तर्क प्रश्नों में जानकारी को संश्लेषित करने की आवश्यकता होती है, जिन्हें समय-संबंधित जानकारी को समझने की आवश्यकता होती है। डेटासेट में J Kneltge प्रश्न भी शामिल हैं, जिसमें सूचना प्रासंगिक को बाहरी Junowledge के साथ बातचीत से एकीकृत करने की आवश्यकता है।

प्रयोगों से पता चलता है कि ए-एमएएमई अधिकांश कार्य श्रेणियों पर अन्य बेसलाइन एजेंटों को आगे बढ़ाता है, खासकर जब ओपन सोर्स मॉडल का उपयोग करते हैं। गौरतलब है कि शोधकर्ताओं का कहना है कि ए-एमईएम प्रश्नों का उत्तर देते समय 10x कम टोकन की आवश्यकता, अनुमान लागत को कम करते समय सबसे अच्छा प्रदर्शन प्राप्त करती है।

प्रभावी मेमोरी प्रबंधन एक बड़ी आवश्यकता बन रही है क्योंकि एलएलएम एजेंट विभिन्न डोमेन और सबसिस्टम में जटिल उद्यम वर्कफ़्लोज़ में एकीकृत होते हैं। A-MEM-JO कोड GitHB-IT में उपलब्ध है, यह कई रूपरेखाओं में से एक है जो उद्यम को मेमोरी-अपलोड किए गए LLM एजेंट बनाने में सक्षम बनाता है।

Scroll to Top