बाहर-विश्लेषण विश्लेषकों: Openai के डीप Purds अनुसंधान जोड़े LLMS तर्क देते हैं एजेंसी RAG के साथ काम को स्वचालित करने और नौकरियों को बदलने के लिए


नवीनतम अपडेट और प्रमुख एआई कवरेज पर विशिष्ट सामग्री के लिए हमारे दैनिक और साप्ताहिक समाचार पत्र में शामिल हों। और अधिक जानें


एंटरप्राइज कंपनियों को Openai के गहरे टांडा अनुसंधान पर ध्यान देने की आवश्यकता है। यह नई क्षमताओं के आधार पर एक शक्तिशाली उत्पाद प्रदान करता है, और यह इतना अच्छा है कि यह नौकरी से बाहर निकल सकता है।

डीप रिसर्च बढ़ती प्रवृत्ति रक्तस्राव की कगार पर है: अपनी क्षमताओं का विस्तार करने के लिए खोज इंजन और अन्य उपकरणों के साथ बड़े -लैंगुएज मॉडल डेल्ट्स (एलएलएम) को एकीकृत करना। । वास्तव में अभी तक उसके हाथ मिल गए।)

ओपन फरवरी के गहरे टांडा अनुसंधान के लिए खुला, ओपनईएआई के साथ एक प्रो खाते की आवश्यकता होती है, जिसकी कीमत $ 200 प्रति माह है, और वर्तमान में केवल अमेरिकी उपयोगकर्ताओं के लिए उपलब्ध है। अब तक, इस प्रतिबंध में वैश्विक डेवलपर समुदाय से प्रारंभिक प्रतिक्रिया हो सकती है, जो आमतौर पर नई एआई प्रगति को फैलाने के लिए त्वरित है।

डीप वैंड रिसर्च मोड के साथ, उपयोगकर्ता किसी भी प्रश्न में Openai के प्रमुख O3 मॉडल से पूछ सकते हैं। परिणाम? मानव विश्लेषक अक्सर सबसे अच्छी रिपोर्ट करते हैं कि क्या उत्पादन करता है, जल्दी और लागत के एक अंश पर।

गहरी वांडा कैसे काम करती है

जबकि डीप वांडा अनुसंधान पर व्यापक रूप से चर्चा की गई है, इसके व्यापक प्रभाव अभी तक पूरी तरह से पंजीकृत नहीं हुए हैं। प्रारंभिक प्रतिक्रियाओं ने इसकी प्रभावशाली अनुसंधान क्षमताओं की सराहना की, इसके उद्धरणों में सामयिक भ्रम के बावजूद। एक व्यक्ति था जिसने कहा कि वह अपनी पत्नी का इस्तेमाल स्तन कैंसर में मदद करने के लिए करता है। उन्होंने कहा कि उनके सी कोनोलॉजिस्ट ने ईआर का विश्लेषण प्रदान किया, बजाय इसके कि विकिरण चिकित्सा क्या कार्रवाई का सही तरीका प्रदान किया गया था, उन्होंने कहा। व्हार्टन एआई के प्रोफेसर एथन मोलिक द्वारा संक्षेपित सर्वसम्मति यह है कि इसके लाभ गलत से बहुत अधिक हैं, क्योंकि कारक के लिए कम समय लगता है कि एआई समग्र रूप से बचाता है। यह वही है जो मैं अपने उपयोग के आधार पर सहमत हूं।

वित्तीय संस्थान पहले से ही आवेदनों की तलाश कर रहे हैं। उदाहरण के लिए, यूएस टॉप -12 बैंक, BNY, क्रेडिट जोखिम आकलन के लिए गहरी पांडा अनुसंधान का उपयोग करने की संभावना को देखता है। इसका प्रभाव स्वास्थ्य सेवा से लेकर खुदरा, विनिर्माण और आपूर्ति श्रृंखला प्रबंधन तक के उद्योगों में विस्तार करेगा – वस्तुतः किसी भी क्षेत्र पर निर्भर करता है जो कि JNowledge का काम है।

स्मार्ट रिसर्च एजेंट

पारंपरिक एआई मॉडल के विपरीत, जो एक शॉट उत्तर की कोशिश करता है, डीप वांडा रिसर्च पहले स्पष्ट प्रश्न पूछता है। वह चार या अधिक प्रश्न पूछ सकता है ताकि आप यह सुनिश्चित कर सकें कि आप क्या चाहते हैं। यह तब एक संरचित अनुसंधान योजना विकसित करता है, कई खोजों को बनाता है, नई अंतर्दृष्टि के आधार पर अपनी योजना में सुधार करता है, और लूप में दोहराता है जब तक कि यह एक व्यापक, अच्छी तरह से अच्छी तरह से रिपोर्ट नहीं करता है। इसमें कुछ मिनट और आधे घंटे लग सकते हैं। रिपोर्ट 1,500 से 20,000 शब्दों तक होती है, और आमतौर पर एक निश्चित URL के साथ 15 से 30 स्रोत शामिल होते हैं, कम से कम पिछले सप्ताह में मेरे उपयोग के अनुसार।

गहन अनुसंधान के पीछे प्रौद्योगिकी: लॉजिक एलएलएम और एजेंटिक चीर

डीप रिसर्च इस तरह से दो प्रौद्योगिकियों को इस तरह से विलय करके करता है कि हमने बड़े पैमाने पर बाजार उत्पादन में पहले नहीं देखा है।

तर्क: पहला Openai का अत्याधुनिक मॉडल, O3 है, जो तार्किक तर्क और विस्तारित श्रृंखला-आइडियोलॉजिकल प्रक्रियाओं की ओर जाता है। जब दिसंबर 2024 में इसकी घोषणा की गई थी, तो ओ 3 ने उपन्यास की समस्या को हल करने के लिए क्षमताओं का परीक्षण करने के लिए डिज़ाइन किए गए सुपर-मुसकेल आर्क-एजीआई बेंचमार्क पर 87.5% एक अभूतपूर्व किया। दिलचस्प बात यह है कि ओ 3 को डेवलपर्स के लिए उपयोग करने के लिए एक एकल मॉडल के रूप में पेश नहीं किया गया है। दरअसल, Openai के सीईओ सैम अल्टमैन ने पिछले हफ्ते घोषणा की कि मॉडल को “एकीकृत खुफिया” प्रणाली में लपेटा जाएगा, जो एजेंटों के साथ मॉडल को एकजुट करेगा, जैसे कि खोज, कोडिंग एजेंट और बहुत कुछ। डीप रिसर्च ऐसे उत्पाद का एक उदाहरण है। और जबकि दीप्सिक-आर 1 जैसे प्रतियोगियों ने ओ 3 क्षमताओं से संपर्क किया है (कुछ हफ्तों पहले बहुत उत्साह क्यों था), ओपनईआई को अभी भी थोड़ा आगे माना जाता है।

एजेंटों: दूसरा, एजेंसी राग, एक ऐसी तकनीक है जो अब लगभग एक वर्ष के लिए है। यह इंटरनेट खोज सहित अन्य स्रोतों के लिए जानकारी और संदर्भ खोजने के लिए एजेंटों का उपयोग करता है। इसमें एपीआई द्वारा गैर-वेब जानकारी खोजने के लिए अन्य टूल-कॉलिंग लिंग एजेंट शामिल हो सकते हैं; कोडिंग एजेंट जो जटिल अनुक्रमों को अधिक कुशलता से पूरा कर सकते हैं; और डेटाबेस खोज। प्रारंभ में, Openai के डीप Dhands अनुसंधान मुख्य रूप से एक खुले वेब की खोज कर रहे हैं, लेकिन कंपनी के नेताओं ने सुझाव दिया है कि यह समय के साथ अधिक स्रोत खोजने में सक्षम होगा।

Openai का एक प्रतिस्पर्धी बढ़त (और इसकी सीमा)

हालांकि ये प्रौद्योगिकियां पूरी तरह से नई नहीं हैं, ओपनईआई की शुद्धि-ने अनुसंधान-गहरे पांडा अनुसंधान को एक नए स्तर पर ले लिया, जो प्रौद्योगिकियों, बड़े फंडों और इसके बंद विकास मॉडल पर इसके कूद-स्टार जैसी चीजों के माध्यम से एक नए स्तर पर ले गए। यह बंद दरवाजों के पीछे काम कर सकता है, और Openai के लोकप्रिय चैटैगप्ट उत्पाद के 300 मिलियन से अधिक सक्रिय उपयोगकर्ताओं से प्रतिक्रिया से लाभ उठा सकता है। Openai ने इन क्षेत्रों में शोध किया है, उदाहरण के लिए, कदम से बेहतर परिणाम कैसे करें। और उन्होंने स्पष्ट रूप से खोज को दिलचस्प रूप से लागू किया है, शायद माइक्रोस .FTS ‘बिंग और अन्य प्रौद्योगिकियों से उधार लेते हैं।

हालांकि यह अभी भी अपने आविष्कार से कुछ परिणामों को भ्रमित कर रहा है, यह प्रतियोगियों से कम है, शायद भाग क्योंकि अंतर्निहित O3 मॉडल इस उदासी के लिए 8%पर एक उद्योग को कम करता है। और अधिक त्रुटियों को कम करने के तरीके हैं, विश्वास थ्रेसहोल्ड जैसे तरीकों का उपयोग करते हुए, आवश्यकताओं का हवाला देते हुए और अन्य परिष्कृत विश्वसनीयता सत्यापन।

इसी समय, ओपनईआई की लीड और क्षमताओं की सीमाएं हैं। डीप रिसर्च के प्रक्षेपण के दो दिनों के भीतर, ह्यूगिंगफेस ने ओपन डीप रिसर्च का एक खुला स्रोत पेश किया, जिसके परिणामस्वरूप ओपनईआई-सो से दूर नहीं थे, वे प्रमुख मॉडल और स्वतंत्र रूप से उपलब्ध एजेंट हैं। कुछ चट्टानें हैं। DeePcics जैसे ओपन-सीरस प्रतियोगी लॉजिक मॉडल के क्षेत्र के करीब होने के लिए तैयार हैं, और माइक्रोस .F का मैगेंटिक-वन केवल दो और उदाहरणों को नाम देने के लिए Openai की अधिकांश एजेंट की क्षमताओं के लिए एक संरचना प्रदान करता है।

इसके अलावा, गहरा अनुसंधान की सीमा है। वेब पर पाई गई अस्पष्ट जानकारी के अनुसंधान के लिए उत्पाद वास्तव में कुशल है। लेकिन उन क्षेत्रों में जहां कोई ऑनलाइन नाखून नहीं है और जहां डोमेन कौशल ज्यादातर निजी हैं – चाहे लोगों के सिर में या निजी डेटाबेस में – यह बिल्कुल भी काम नहीं करता है। इसलिए, यह उच्च-फाइनल हेज-फंड शोधकर्ताओं की नौकरियों को खतरे में नहीं डालेगा, उदाहरण के लिए, बेन वें ओम एमपीसन के तर्क के अनुसार, यह उद्योग में वास्तविक विशेषज्ञों से बात करने के लिए भुगतान किया जाता है। नवीनतम पोस्ट में (नीचे ग्राफिक देखें)। ज्यादातर मामलों में, डीप ओपन ओपन रिसर्च कम कुशल विश्लेषक नौकरियों को प्रभावित करेगा।

गहरी नेलिन अनुसंधान का मूल्य पहले बढ़ता है क्योंकि जानकारी दुर्लभ है, फिर नीचे गिर जाती है जब यह वास्तव में दुर्लभ है। स्रोत: रणनीति।

अभी भी सबसे बुद्धिमान उत्पाद

जब आप एक एजेंटिक रिकवरी के साथ शीर्ष-स्तरीय तर्क को मर्ज करते हैं, तो यह वास्तव में आश्चर्य की बात नहीं है कि आपको ऐसा शक्तिशाली उत्पाद मिलता है। ओपन डीप ओपन रिसर्च ने मानवता की अंतिम परीक्षा में 26.6% प्राप्त किया, जो खुफिया के लिए सर्वश्रेष्ठ बेंचमार्क पर बहस करता है। किसी भी एआई मॉडल के लिए 100 अलग -अलग विषयों में 3,000 प्रश्नों को कवर करते हुए, यह एक अपेक्षाकृत नया एआई बेंचमार्क है जिसे किसी भी एआई मॉडल को पूरा करने के लिए सबसे कठिन के लिए डिज़ाइन किया गया है। इस बेंचमार्क में, Openai के गहरी छड़ी अनुसंधान पिछले मॉडल जैसे कि डीप वांडा रिसर्च (20.5%) और O3-Mini (13%) और दीपको-R1 (9.4%), जो एजेंटों से जुड़े नहीं थे। लेकिन प्रारंभिक समीक्षाएं गुणवत्ता और गहराई दोनों में खुले लीड का संकेत देती हैं। Google की गहरी छड़ी अनुसंधान के इस बेंचमार्क का परीक्षण किया जाना बाकी है, लेकिन प्रारंभिक समीक्षाओं से पता चलता है कि गुणवत्ता और गहराई दोनों Openai लीड हैं।

यह कैसे अलग है: पहला मास-मार्केट एआई जो नौकरियों को विस्थापित कर सकता है

यह उन नौकरियों को हटाने की संभावना है जो इस उत्पाद के साथ अलग हैं। रेड ड्रैगन के कॉफ ओन और एआई एजेंटों के डेवलपर सैम विटविन, मेरे साथ गहरी छड़ी -वीडियो चर्चा में मेरे साथ अवलोकन करते हैं कि बहुत से लोग कहेंगे: “पवित्र बेतुका, मैं इन रिपोर्टों को $ 200 में प्राप्त कर सकता हूं कि मुझे कुछ मिल सकता है। शीर्ष -4 परामर्श कंपनी जो मुझे $ 20,000 खर्च करेगी, “वह नौकरी सहित कुछ वास्तविक बदलावों का कारण बनेगा।

जो मुझे पिछले हफ्ते अपने साक्षात्कार में वापस लाता है, न्यूयॉर्क शहर में एक बड़े अमेरिकी बैंक के साथ एक पट्टानक के साथ, BNY में एक इंजीनियरिंग प्रमुख, और AI।

यह सुनिश्चित करने के लिए, पट्टानक ने अपने बैंक में वास्तविक नौकरी की गणना के लिए उत्पाद के अनुष्ठानों के बारे में कुछ नहीं कहा। यह एक विशेष रूप से संवेदनशील विषय होगा कि किसी भी उद्यम को शायद सार्वजनिक जनता को संबोधित करने में शर्म आनी चाहिए। लेकिन उन्होंने कहा कि वह क्रेडिट अंडरराइटिंग रिपोर्ट और अन्य “टॉपलाइन” गतिविधियों के लिए ओपनईआई के डीप पांडा अनुसंधान का उपयोग देख सकते हैं, और विभिन्न नौकरियों पर महत्वपूर्ण प्रभाव डालते हैं: “यह अब हर नौकरी को प्रभावित नहीं करता है, लेकिन यह नौकरी के द्रव्यमान को प्रभावित करता है। (और) अनुसंधान के आसपास, तुलना विक्रेता प्रबंधन, उत्पाद की तुलना में उत्पाद की तुलना। “उन्होंने कहा:” तो मुझे लगता है कि सिस्टम दो सोच पर सब कुछ है – अधिक शोध, जहां यह सही उत्तर नहीं हो सकता है, क्योंकि एक बार आपके पास यह परिदृश्य सही उत्तर माउंट किया जा सकता है – मुझे लगता है कि यह एक मौका है। “

एक इतिहास

तकनीकी क्रांति ने लंबे समय में कुछ समय में इतिहास को विस्थापित कर दिया है जब लंबे समय में नए उद्योग बनाते हैं। घोड़े के वाहनों को बदलने के लिए लिपिक कार्य को स्वचालित करने के लिए, नौकरी के बाजार विकसित होते हैं। डिस्टर्बिंग टेक्नोलॉजीज द्वारा बनाए गए नए अवसरों में एक नया किराए पर लेने की प्रवृत्ति होती है। इन प्रगति को स्वीकार करने में विफल होने वाली कंपनियां अपने प्रतिद्वंद्वियों के पीछे होंगी।

गहरे टांडा अनुसंधान और श्रम के बीच, ओपनई के ऑल्ट लेटमैन ने इस लिंक को स्वीकार कर लिया, भले ही वह अप्रत्यक्ष हो। पिछले हफ्ते पेरिस में एआई शिखर सम्मेलन में, उनसे आर्टिफिशियल जनरल इंटेलिजेंस (एजीआई) के लिए उनकी दृष्टि के बारे में पूछा गया था, या उस मंच पर जहां एआई उतना ही काम कर सकता है जितना कोई भी कर सकता है। जैसा कि उन्होंने जवाब दिया, उनका पहला संदर्भ गहरे वांडा अनुसंधान के लिए था: “यह एक ऐसा मॉडल है जो मुझे लगता है कि अब दुनिया की अर्थव्यवस्था के सभी काम को कम-एकल-अंकों के प्रतिशत के रूप में करने में सक्षम है, जो एक पागल बयान है, और एक वर्ष है पहले मुझे ऐसा कुछ नहीं लगता जो लोग सोचते थे या आ रहे थे। “(इस वीडियो का मिनट तीन देखें) उन्होंने जारी रखा:” COMPP सेंट के लिए, आप $ 500 या $ 5,000 काम कर सकते हैं।

टेकवे: जे नॉलेज वर्क के लिए एक नया युग

जुनवेले -आधारित उद्योगों में एआई के लिए एक वाटरशेड क्षण द्वारा डीप रिसर्च का प्रतिनिधित्व किया जाता है। स्वायत्त अनुसंधान क्षमताओं के साथ अत्याधुनिक तर्क को एकीकृत करके, ओपन ने एक उपकरण बनाया है जो मानव विश्लेषकों की तुलना में होशियार, तेज और काफी अधिक प्रभावी है।

ये प्रभाव बहुत बड़े हैं, वित्तीय सेवाओं से लेकर हेल्थकेयर से लेकर एंटरप्राइज़ फैसले तक। इस तकनीक को प्रभावी ढंग से लाभान्वित करने वाले संगठन महत्वपूर्ण प्रतिस्पर्धी किनारों को प्राप्त करेंगे। जो लोग इसे अनदेखा करते हैं, वे अपने जोखिम पर ऐसा करते हैं।

गहरी गहरी गहरी गहरी गहरी गहरी गहरी जाँच करें कि हमारे पिछले वीडियो में सैम विटिन के साथ टकिंग कोवेस्टियन में मेरी जाँच करें, यह चर्चा करने के लिए कि अनुसंधान कैसे काम करता है और जे ज्ञान के काम को आकार देता है।

https://www.youtube.com/watch?v=3M3QCF_PTDC

Scroll to Top