नवीनतम अपडेट और प्रमुख एआई कवरेज पर विशिष्ट सामग्री के लिए हमारे दैनिक और साप्ताहिक समाचार पत्र में शामिल हों। और अधिक जानें
अरबों ने एआई स्टार्टअप्स को $ 4 बिलियन से अधिक की कीमत पर गले लगाया, एक ओपन-सायर्स पायथन लाइब्रेरी FRTTC को जारी किया, जो रियल-टाइम ऑडियो डियो और वीडियो एआई ऐप बनाते समय डेवलपर्स के लिए एक बड़ी बाधा को दूर करता है।
FastrTC के रचनाकारों में से एक, X.com पर एक घोषणा में कहा, “पायथन में रियल-टाइम वेबर्ट्स और वेबसोकेट एप्लिकेशन प्राप्त करना बहुत मुश्किल है।” “आज तक।”
WBRTC तकनीक ऑडियो DEO, वीडियो और डेटा शेयरिंग के लिए प्लगइन्स या डाउनलोड के बिना डायरेक्ट ब्राउज़र-टू-ब्राउज़र संचार को सक्षम बनाती है। यद्यपि आधुनिक आवाज आईएसआईएस सहायकों और वीडियो टूल के लिए आवश्यक है, वेबर्टक का कार्यान्वयन एक विशेष कौशल रहा है जो कि अधिकांश मशीन लर्निंग (एमएल) इंजीनियरों के पास नहीं है।
एक रियल-टाइम वेबरकुलोसिस और वेबसॉकेट ऐप बनाना पायथन में बिल्कुल मुश्किल है।
अब तक – FRTTC का परिचय, पायथन के लिए रियलटाइम कम्युनिकेशन लाइब्रेरी Pic.twitter.com/pr67kiz9ke
– फ्रेडी ए बी ओउल लोन (@freddie_aulti_) 25 फरवरी, 2025
वॉयस एआई गोल्ड रश अपने तकनीकी मार्ग बाधा को पूरा करता है
समय अधिक रणनीतिक नहीं हो सकता है। वी वॉयस एआई ने बहुत ध्यान आकर्षित किया है और पूंजी को आकर्षित किया है – इलेवनब्स ने हाल ही में मिलियन 180 मिलियन फंड प्राप्त किए हैं, जबकि कुताई, अलीबाबा और फिक्सी जैसी कंपनियों ने सभी विशेष ऑडियो डियो मॉडल पेश किए हैं।
फिर भी, ये अत्याधुनिक एआई मॉडल और तकनीकी संरचनाएं वास्तविक समय के अनुप्रयोगों में तैनात करने के लिए आवश्यक तकनीकी संरचनाओं के बीच डिस्कनेक्ट करना जारी रखते हैं। जैसा कि अपने एचएल पोस्ट पोस्ट पोस्ट में उल्लेख किया गया है, “एमएल इंजीनियरों को वेबर्टसी जैसे वास्तविक समय के अनुप्रयोगों को बनाने के लिए आवश्यक प्रौद्योगिकियों का अनुभव नहीं हो सकता है।”
FASTRTC इस समस्या को संबोधित करता है, जिसमें स्वचालित विशेषताएं वास्तविक समय के संचार के जटिल भागों को संभालती हैं। लाइब्रेरी एप्लिकेशन प्रदान करता है वॉयस का पता लगाने, मोड़ क्षमता, परीक्षण इंटरफेस और एक्सेस सेस के लिए अस्थायी फोन नंबर जनरेशन है।
के साथ वास्तविक समय के एप्लिकेशन बनाना चाहते हैं @Googledepmind मिथुन 2.0 फ्लैश? FASTRTC आपको ग्रैडियो-यूआई का उपयोग करके पायथन-आधारित वास्तविक समय के एप्लिकेशन बनाने की अनुमति देता है। ?
? न्यूनतम कोड के साथ पायथन कार्यों को द्विपक्षीय ऑडियो डीओ/वीडियो स्ट्रीम में बदल देता है
– फिलिप शेड (@_philschmid) 26 फरवरी, 2025
? ️ अंतर्निहित आवाज का पता लगाने और स्वचालित है … Pic.twitter.com/O835HTR0HL
जटिल बुनियादी ढांचे से लेकर कोड की पांच पंक्तियों तक
पुस्तकालय का प्राथमिक लाभ इसकी सहजता है। डेवलपर्स केवल कोड की कुछ पंक्तियों में बुनियादी रियल-टाइम ऑडियो डियो एप्लिकेशन बना सकते हैं-जो पहले से आवश्यक विकास कार्य के सप्ताह के विपरीत है।
इन बदलावों में व्यवसायों के लिए महत्वपूर्ण प्रभाव पड़ता है। पहले से विशेष संचार इंजीनियरों की जरूरत कंपनियों को आवाज और वीडियो एआई सुविधाओं बनाने के लिए अपने मौजूदा पायथन डेवलपर्स का लाभ उठा सकती है।
विज्ञापन बताते हैं, “आप किसी भी एलएलएम/टेक्स्ट-टू-स्पीच/स्पीच-टू-टेक्स्ट एपीआई या स्पीच-टू-ऑल-राउंड मॉडल का उपयोग कर सकते हैं।” “आपके द्वारा पसंद किए जाने वाले उपकरण लाओ- fastrtc केवल वास्तविक समय संचार परत को संभालता है।”
हॉट टेक: वेबर्टी पायथन कोड की एक पंक्ति होनी चाहिए
Gradio से Fastrtc⚡ का परिचय!
अब शुरू करें: PIP स्थापित FASTRTC
आपको क्या मिलता है:
– असली फोन से अपने एआई को कॉल करें
– स्वचालित शोर की जाँच
– किसी भी मॉडल के साथ काम करता है
– परीक्षण के लिए तत्काल ग्रेडियो यूआईयह सब बदल देता है Pic.twitter.com/kvx436xbg
– ग्रेडियो (@gradio) 25 फरवरी, 2025
ध्वनि और वीडियो नवाचार की अगली लहर
FASTRTC की शुरूआत AI अनुप्रयोग विकास में एक मोड़ को इंगित करती है। महत्वपूर्ण तकनीकी बाधाओं को समाप्त करके, उपकरण उन संभावनाओं को खोलता है जो कई डेवलपर्स के लिए सैद्धांतिक बने रहे।
प्रभाव छोटी कंपनियों और स्वतंत्र डेवलपर्स के लिए विशेष रूप से सार्थक हो सकता है। जबकि Google और Openai जैसे टेक दिग्गजों के पास कस्टम रियल-टाइम संचार बुनियादी ढांचा बनाने के लिए इंजीनियरिंग संसाधन हैं, अधिकांश संगठन नहीं हैं। FASTRTC अनिवार्य रूप से उन क्षमताओं की उपकर प्रदान करता है जो पहले विशेष टीमों वाले लोगों के लिए आरक्षित थे।
लाइब्रेरी की “कुकबुक” पहले से ही विभिन्न अनुप्रयोगों को प्रदर्शित करती है: वॉयस विभिन्न भाषा मॉडल, रियल-टाइम वीडियो ऑब्जेक्ट buject buject detaction और इंटरैक्टिव कोड जेनरेशन द्वारा कमांड है।
विशेष रूप से महत्वपूर्ण समय समय है। AI इंटरफेस को अधिक प्राकृतिक, मल्टीमॉडल अनुभवों की ओर पाठ-आधारित इंटरैक्शन से हटा दिया जाता है। आज सबसे परिष्कृत एआई सिस्टम पाठ, चित्र, ऑडियो देओ और वीडियो को संसाधित और उत्पन्न कर सकते हैं, लेकिन इन क्षमताओं का जवाब देने के लिए, यह वास्तविक समय के अनुप्रयोगों में तैनात करने के लिए चुनौतीपूर्ण रहा है।
एआई मॉडल डेलो और वास्तविक समय के संचार के बीच की दूरी को हटाकर, FastrTC बस विकास की सुविधा नहीं देता है-यह संभावित रूप से वॉयस-फर्स्ट और वीडियो-एन्हांस्ड एआई अनुभवों की ओर व्यापक बदलाव को तेज करता है जो अधिक मानव और कम कंप्यूटर दिखते हैं।
उपयोगकर्ताओं के लिए, इसका मतलब एप्लिकेशन में अधिक प्राकृतिक इंटरफेस हो सकता है। व्यवसायों के लिए, इसका मतलब है कि उन सुविधाओं का एक त्वरित कार्यान्वयन जो उनके ग्राहक अधिक से अधिक उम्मीद करते हैं।
अंत में, FASTRTC प्रौद्योगिकी में क्लासिक समस्या को संबोधित करता है: शक्तिशाली क्षमताएं अक्सर अनुपयोगी होती हैं जब तक कि वे मुख्यधारा के डेवलपर्स के लिए सुलभ नहीं होते हैं। एक बार जटिल होने से सरल बनाकर, हग का चेहरा आज के परिष्कृत एआई मॉडल और कल की आवाज के बीच खड़े अंतिम बड़ी बाधाओं में से एक को हटा देता है।
वीबी दैनिक के साथ पेशेवर उपयोग के मामलों पर दैनिक अंतर्दृष्टि
यदि आप अपने बॉस को प्रभावित करना चाहते हैं, तो वीबी ने आपको हर दिन कवर किया है। हम आपको एक अंदर के स्कूप देते हैं कि विनियामक शिफ्ट से लेकर प्रैक्टिकल परिनियोजन तक की कंपनियां एआई उत्पन्न करने के साथ क्या कर रही हैं, इसलिए आप अधिकतम आरओआई के लिए अंतर्दृष्टि साझा कर सकते हैं।
हमारी गोपनीयता नीति पढ़ें
सदस्यता के लिए धन्यवाद। यहां और अधिक वीबी न्यूज़लेटर्स देखें।
एक त्रुटि पाई गई।
