Reddit AI को प्रशिक्षित करने के लिए उपयोगकर्ता डेटा को स्क्रैप करने के लिए एन्थ्रोपिक दावे

आर्टिफिशियल इंटेलिजेंस कंपनी प्लेटफ़ॉर्म से उपयोगकर्ता सामग्री को खींचने और इसके क्लाउड एआई मॉडल को प्रशिक्षित करने के लिए इसका उपयोग करके रेडिट एंथ्रोपिक को अदालत में ले जा रही है। कैलिफोर्निया स्टेट कोर्ट में दायर मुकदमे का दावा है कि रेडिट के सर्वर के लिए एन्थ्रोपिक ने 100,000 से अधिक अनधिकृत अनुरोध किए, सार्वजनिक रूप से कहा कि यह बंद हो गया था।

यह मामला रेडट के आसपास किया गया है कि एंथ्रोप्रॉप तकनीकी प्रतिबंधों और उसकी सेवा की शर्तों को नजरअंदाज करता है। शिकायत के अनुसार, एन्थ्रोपिक साइट के रोबोट्स.टीएक्सटी फ़ाइल के संरक्षण को बायपास करता है, जो कि स्वचालित स्क्रैपिंग को रोकने के लिए माना जाता है। Reddit ने व्यक्तिगत पोस्टों को एकत्र करके और उपयोग करके उपयोगकर्ता की गोपनीयता का उल्लंघन करने का भी आरोप लगाया, जिसमें वाणिज्यिक उद्देश्यों के लिए हटाए गए सामग्रियों को शामिल किया गया है।

Reddit का कहना है कि यह Openai और Google जैसी कंपनियों के साथ लाइसेंस समझौते के माध्यम से अपने डेटा के संरचित प्रस्तावों को प्रदान करता है। इन सौदों में सामग्री, गोपनीयता सुरक्षा और डेटा tion के उपयोग के लिए शर्तें शामिल हैं। प्लेटफ़ॉर्म के अनुसार, एन्थ्रोपिक ने एक टिप्पणी पचरिक समझौता करने से इनकार कर दिया और इसके बजाय साइट को सीधे स्क्रैप किया, लाइसेंस शुल्क से बचने और प्रक्रिया में उपयोगकर्ता की रक्षा को छोड़ दिया।

मुकदमे में, एन्थ्रोपिक सीईओ को डारियो मोड को सह-लिखित 2021 शोध पत्र द्वारा प्रकाशित किया गया है, जिसने रेडिट को भाषा मॉडल के लिए प्रशिक्षण डेटा के समृद्ध स्रोत के रूप में इंगित किया। Reddit में ऐसे उदाहरण भी शामिल थे, जहां क्लाउड Reddit पोस्ट के लिए शब्द भी उपयोगकर्ताओं द्वारा पुन: पेश किए गए दिखाई दिए, यहां तक ​​कि हटाए गए पोस्ट भी। कंपनी का कहना है कि, यह दर्शाता है कि एन्थ्रोपिक सामग्री की गोपनीयता या सामग्री का सम्मान करने के लिए बगीचे को डालने में विफल रहा।

Reddit आर्थिक नुकसान और अदालत के आदेश की मांग कर रहा है जो अपने मॉडलों के भविष्य के संस्करणों में Reddit सामग्री का उपयोग करने से एंथ्रोपिक को रोकता है।

एंथ्रोपी ने जवाब दिया है, यह दावा करते हुए कि वह दावों और खुद की रक्षा करने की योजना से असहमत है। हालांकि, यह पहली बार नहीं है जब निगम इस बात पर कानूनी दबाव में आया है कि यह कैसे प्रशिक्षण डेटा एकत्र करता है।

अगस्त 2024 में, लेखकों के एक समूह ने एक क्लास-एक्शन केस का मुकदमा दायर किया, जिसमें एन्थ्रोपिक ने एन्थ्रोपिक को बिना अनुमति के अपनी कॉपी पाइराइट काम का उपयोग करने का आरोप लगाया। उन्होंने दावा किया कि पे फर्म ने अपनी सहमति के बिना पुस्तकों और अन्य लिखित सामग्रियों पर अपने मॉडल डेलो को प्रशिक्षित किया था और फिर अपनी सामग्री का उपयोग करने के लिए मुआवजे का अनुरोध किया था।

अक्टूबर कैटबर 2023 के एक ही मामले में यूनिवर्सल म्यूजिक ग्रुप और अन्य प्रकाशक शामिल हैं। उन्होंने दावों पर एन्थ्रोपिक के खिलाफ दावा किया कि कॉपी पाइराइट पाइराइट के गीतों की इसके क्लाउड चैट ओट टी टी टी री रॉड। संगीत कंपनियों ने तर्क दिया कि इस उपयोग ने उनके बौद्धिक संपदा अधिकारों का उल्लंघन किया और अदालत से अपने गीतों के आगे उपयोग को अवरुद्ध करने के लिए कहा।

मुकदमे के विपरीत, Reddit का मामला कॉपीराइट पाइराइट पर ध्यान केंद्रित नहीं करता है। इसके बजाय, यह एक अनुबंध उल्लंघन और अनुचित प्रतियोगिता पर केंद्रित है। Reddit का तर्क यह है कि इसकी साइट से लिया गया डेटा केवल सार्वजनिक नहीं है – यह उन शर्तों से नियंत्रित होता है कि एन्थ्रोपिक को जानबूझकर अनदेखा किया जाता है। यह अंतर मामले को किसी अन्य प्लेटफ़ॉर्म के लिए महत्वपूर्ण बना सकता है जो उपयोगकर्ता सामग्री को होस्ट करता है लेकिन यह नियंत्रित करना चाहता है कि इसका उपयोग पेशेवर एआई सिस्टम में कैसे किया जाता है।

रेडिट ने सार्वजनिक भ्रामक के एन्थ्रिक पर भी आरोप लगाया। मुकदमा एंथ्रोपिक के सार्वजनिक बयानों की ओर इशारा करता है कि वह नियमों को स्क्रैप करने और उपयोगकर्ता की गोपनीयता को महत्व देता है, जो कि रेडिट का कहना है कि कंपनी के कार्यों से विरोधाभासी था।

“अपने हिस्से के लिए, इसकी मार्केटिंग सामग्री क्या कहती है, इसके बावजूद, एन्थ्रोपिक रेडिट के नियमों या उपयोगकर्ताओं के बारे में परवाह नहीं करता है,” मुकदमा पढ़ता है। “वह मानता है कि वह जो भी सामग्री चाहता है उसे लेने का हकदार है और उस सामग्री का उपयोग करता है, हालांकि, मुक्ति के साथ।”

मुकदमे में प्रवेश करने के बाद, REDDT के स्टॉक में लगभग 67%की वृद्धि हुई, एक संकेत जो निवेशकों ने इस कदम का समर्थन किया। इस मामले के परिणाम इस बात का उदाहरण निर्धारित कर सकते हैं कि कैसे कंपनियां खुली इंटरनेट सामग्री और उपयोगकर्ताओं और सामग्री मालिकों के अधिकारों के बीच संतुलन बनाती हैं।

चूंकि अधिक एआई कंपनियां बड़ी मात्रा में डेटा नलिन डेटा पर निर्भर करती हैं, इसलिए स्क्रैपिंग के आसपास कानूनी और नैतिक सवालों को अनदेखा करना मुश्किल है। Reddit का मामला AI विकास की यह अगली लहर कैसे सामने आता है, इसकी आकार सूची बढ़ाता है।

(ब्रेट जॉर्डन द्वारा फोटो)

यह भी देखें: ऑटो टोमेशन में नैतिकता: पूर्वाग्रह और एआई के अनुपालन को संबोधित करने के लिए

एआई एक्सपो बैनर जहां उपस्थित लोग भ्रम और अधिक मॉडल जैसे मुद्दों के बारे में जानेंगे।

उद्योग के नेताओं से एआई और बड़े डेटा के बारे में अधिक जानना चाहते हैं? एम्स्टर्डम, कैलिफोर्निया और लंदन में आयोजित एआई और बिग डेटा एक्सपो की जाँच करें। ब्रॉड इवेंट को इंटेलिजेंट ऑटो टोमेशन कॉन्फ्रेंस, ब्लॉकएक्स, डिजिटल ट्रांसफॉर्मेशन वीक और साइबर सिक्योरिटी एंड क्लाउड एक्सपो सहित अन्य प्रमुख घटनाओं के साथ सह-स्थित किया गया है।

TechFire द्वारा संचालित अन्य आगामी उद्यम प्रौद्योगिकी घटनाओं और वेबिनार का अन्वेषण करें।

Scroll to Top