Fino1-8b से मिलें: लालमा 3.1 8B निर्देश का एक अच्छा संस्करण वित्तीय तर्क कार्यों पर प्रभाव को बेहतर बनाने के लिए डिज़ाइन किया गया है

वित्तीय जानकारी को समाप्त करना अर्थात्, संख्याओं का विश्लेषण, वित्तीय शर्तें और संगठित डेटा जैसे कि उपयोगी अंतर्दृष्टि के लिए टेबल। इसके लिए आर्थिक अवधारणाओं, नियमों और वित्तीय स्थितियों के बीच गणित की गणना और न्याय की आवश्यकता होती है। हालांकि सभ्य ए.आई. मॉडल ने उत्कृष्ट सामान्य तर्क क्षमताओं को दिखाया है, वित्तीय कार्यों के लिए उनकी खूबियां संदिग्ध हैं। इस तरह के कार्यों को सरल गणितीय गणना से अधिक की आवश्यकता होती है क्योंकि इनमें डोमेन-विशिष्ट शब्दावली की व्याख्या करना, वित्तीय मुद्दों के बीच संबंधों को पहचानना और संरचित वित्तीय डेटा का विश्लेषण करना शामिल है।

आम तौर पर, तर्क के दृष्टिकोण की तरह सोचा फाइन-ट्यूनिंग और सुदृढीकरण सीखने का काम कई कार्यों पर प्रभाव को तेज करता है लेकिन वित्तीय तर्क के साथ टूट जाता है। वे तार्किक तर्क में सुधार करते हैं, लेकिन आर्थिक जानकारी की जटिलता की नकल नहीं करते हैं, जिसके लिए संख्यात्मक समझ, क्षेत्र के क्षेत्र और एक संगठित तरीके से डेटा व्याख्या की आवश्यकता होती है। जबकि बड़े -लैंग्वेज मॉडल का उपयोग व्यापक रूप से भावना विश्लेषण, बाजार पूर्वानुमान और स्वचालित व्यापार जैसे कार्यों के लिए किया जाता है, वित्तीय तर्क के लिए सामान्य मॉडल इष्टतम नहीं हैं। धन-विशिष्ट मॉडल, जैसे मोरबर्गप्ट और उंगलियों कावित्तीय शर्तों को समझने में मदद करता है, लेकिन वित्तीय दस्तावेजों और संरचनात्मक डेटा का तर्क अभी भी चुनौतियों का सामना करता है।

इसे हल करने के लिए, शोधकर्ता Thefinai सूचित पूर्व दर्शनवित्तीय तर्क मॉडल के आधार पर लालमा -3.1-8 बी-सस्ट्रक्ट। मौजूदा मॉडल वित्तीय पाठ, सारणीबद्ध डेटा और समीकरणों के साथ संघर्ष करते हैं, जो लंबे संदर्भ कार्यों और मल्टी-टेबल लॉजिक में खराब प्रदर्शन दिखाते हैं। सरल डेटासेट अपडेट और सामान्य तकनीकों की तरह नली निरंतर परिणाम लाने में फाइन-ट्यूनिंग विफल रहा। इस संरचना में सुदृढीकरण शिक्षा और दोहराव संचालन है नली वित्तीय तर्क, तार्किक कार्रवाई शोधन और निर्णयों की सटीकता बढ़ाने के लिए ठीक ट्यूनिंग। तार्किक अनुक्रमों को व्यवस्थित रूप से बनाया गया था ताकि मॉडल वित्तीय मुद्दों का विश्लेषण कर सके, और उचित वित्तीय निष्कर्षों को निर्धारित करने के लिए परीक्षण विधियों का परीक्षण विश्वसनीयता का परीक्षण कर सके। एक किस्म लोरा दूसरे चरण में फाइन-ट्यूनिंग आँकड़े और ठीक-ट्यूनिंग, जटिल गणना के लिए मॉडल को ठीक करने के साथ, संख्यात्मक तर्क और समीकरण contraindications को हल करता है। विभिन्न वित्त डेटासेट, जैसे रिपोर्ट और सारणीबद्ध डेटा, अधिक सटीक वित्तीय विवरण और लेनदेन रिकॉर्ड विश्लेषण जैसे संगठित प्रशिक्षण प्रदान करने के लिए संवर्धित व्याख्या।

शोधकर्ताओं ने वित्तीय तर्क कार्यों पर भाषा मॉडल का मूल्यांकन और पाया डिपसेक-आर 1 सर्वश्रेष्ठ प्रदर्शन (68.93) दृढ़ता से एक्सबीआरएलअंक शास्त्र परिणाम, फिर DIPCICK-R1-DISTIL-LALAAMA-70B और DIPCICK-R1-DISTIL-QUAN-32Bजीपीटी कम XBRL-MATH के स्कोर के कारण अच्छा लेकिन पीछे छोड़ दिया गया। सामान्य इरादे के मॉडल की तरह लालमा 3.3-70 बी कुछ तर्क-केंद्रित मॉडल डेलो को आगे बढ़ाते हैं, यह दिखाते हैं कि सामान्य तर्क हमेशा वित्तीय कार्यों को नहीं बढ़ाता है। शोधकर्ताओं ने पाया कि तार्किक-कार्य ठीक-ट्यूनिंग आर्थिक डेटा के साथ संघर्ष करता है, जबकि गणितीय वृद्धि में सुधार हुआ है XBRL मेथ घायल भी फिन -पेपर और मोर-सिम्पलिंग सटीकता। स्केलिंग मॉडल का आकार हमेशा मदद नहीं करता है, क्योंकि छोटे मॉडल कभी -कभी बेहतर प्रदर्शन करते हैं। पूर्व-टैलिस्मन डेटा का विस्तार करके और प्रशिक्षण तकनीकों के बाद सुधार करके वित्तीय तर्क में सुधार किया गया। फिनो 1-8 बीसे तर्क के मार्ग के साथ प्रशिक्षित Gpt -4o, दूसरों को धक्का देना, वित्तीय-विशिष्ट प्रशिक्षण साबित करना। इन परिणामों ने वित्तीय समझ और बहु-चरण संख्यात्मक तर्क को बेहतर बनाने के लिए डोमेन-विशिष्ट प्रशिक्षण के महत्व पर प्रकाश डाला।

सारांश में, नए दृष्टिकोण ने एलएलएम में वित्तीय सोच में सुधार किया। से तर्कसंगत तरीकों का लाभ उठाकर जीपीटी निरंतर फिन -पेपर, पूर्व दर्शन था 10% तीन वित्तीय परीक्षणों में बेहतर। हालांकि मैटेमल पचरिक गणितीय मॉडल डेलो ने संख्यात्मक कार्यों पर सबसे अच्छा प्रदर्शन किया XBRL मेथउन्होंने वित्तीय पाठ और लंबे संदर्भों को संसाधित करने में अपेक्षाओं को कम कर दिया, जिसमें डोमेन अनुकूलन की आवश्यकता होती है। मॉडल स्केल और डेटासेट किस्म के बावजूद, यह संरचना भविष्य के अनुसंधान के लिए आधार रेखा के रूप में कार्य कर सकती है। डेटासेट विस्तार में प्रगति, रेडी प्रोक्योरमेंट-डिसेबल्ड मेथड्स और मल्टी-स्टेप लॉजिक अधिक वित्तीय हो सकते हैं लोर वास्तविक -वर्ल्ड अनुप्रयोगों के लिए।


जाँच करना एक गले के चेहरे पर कागज और मॉडल। इस शोध के लिए सभी श्रेय इस परियोजना के शोधकर्ताओं को जाते हैं। इसके अलावा, हमें फॉलो करने के लिए स्वतंत्र महसूस करें ट्विटर और हमसे जुड़ने के लिए मत भूलना 75 के+ एमएल सब्राडिट

अनुशंसित रीडिंग- एलजी एआई रिसर्च नेक्सस प्रकाशित करता है: एक उन्नत प्रणाली एआई एजेंट एआई सिस्टम और डेटा अनुपालन मानकों को एआई डेटासेट में कानूनी चिंताओं को खत्म करने के लिए


Divish मार्केटकपोस्ट में एक परामर्श इंटर्न है। वह खड़गपुर के एक भारतीय संगठन प्रौद्योगिकी एफ प्रौद्योगिकी से कृषि और खाद्य इंजीनियरिंग में BTech का पीछा कर रहे हैं। यह एक डेटा साइंस और मशीन लर्निंग उत्साही है जो इन प्रमुख तकनीकों को कृषि में एकीकृत करना चाहता है और चुनौतियों को हल करना चाहता है।

Scroll to Top