REDDIT适合清洁用户数据以教授AI的人类

Reddit将Anthrop送往法院,指责公司未经许可就从平台中提取用户内容并使用它来教Claude AI模型。加利福尼亚法院提起的诉讼声称,即使他公开表示自己已经停止,人类对Reddit服务器提出了超过100,000多个未经授权的请求。

该案是围绕Reddit的声明构建的,即Anthropus忽略了技术限制和服务条件。根据投诉,拟人保护措施为保护,例如robots.txt站点文件,这应防止自动刮擦。 Reddit还指责炭疽病违反用户机密性,收集和使用个人帖子(包括远程内容)出于商业目的。

Reddit指出,它通过与OpenAI和Google等公司的许可协议提供结构化访问其数据的访问权限。这些交易包括与内容使用,保密性保护和删除数据有关的条件。根据该平台,Anthropic拒绝达成正式协议,而是直接拍摄了网站,避免了许可费并跳过用户。

该诉讼强调了2021年的研究文件,并在Antrop Dario Amodea的总董事的帮助下作者,他指出Reddit是语言模型的丰富教育数据来源。 Reddit还包括Claude在可见的帖子中复制reddit帖子的示例,几乎是一个单词,甚至重复了用户删除的消息。根据该公司的说法,这表明Anpropic无法建立围栏,以尊重用户的机密性或内容的收集。

Reddit正在寻找财务损失和法院判决,该判决将干扰其模型的未来版本中Reddit内容的人为使用。

拟人化的回应说,声称他不同意辩护的主张和计划。然而,这并不是公司第一次在收集培训数据时承受法律压力。

2024年8月,一群作者在班级上提起诉讼,指责源自无允许使用其受版权保护的作品。他们声称,该公司未经同意就向书籍和其他书面材料教授了其模型,然后要求赔偿其内容。

从2023年10月开始的类似案件包括通用音乐集团和其他出版商。他们指控他的Claude Chatte Chatter复制了歌曲的文字,对Anthrop提起了诉讼。音乐公司声称这种用途侵犯了他们的知识产权,并要求法院阻止其文本的进一步使用。

与这些试验不同,REDDIT案件并不集中于版权。相反,他专注于违反合同和不公平竞争。 Reddit论点是,从其站点获取的数据不仅是公开的 – 它们受到Anthropo中故意忽略的术语的监管。这种差异可以使此情况对于执行用户内容但要控制商业AI系统中的其他平台重要。

Reddit还指责人类对流的误解。该诉讼表明了人类的公开声明,该声明声称他尊重清洁规则并赞赏用户的机密性,根据Redid的说法,这与公司的行为相矛盾。

该诉讼说:“尽管他的营销材料说,但他不在乎Reddit的规则或用户。” “他认为,他有权掌握他想要的任何内容并使用这些内容,无论他希望如何,不受惩罚。”

提起诉讼后,Reddit股票增加了近67%,这表明投资者支持这一步骤。案例的结果可以为公司的互联网内容与用户和内容所有者的权利之间的平衡创造先例。

由于AI中越来越多的公司依靠大量在线,因此与刮擦有关的法律和道德问题,变得越来越难以忽视。 Reddit的情况增加了越来越多的试验列表,这些试验列出了下一波AI如何发展。

(布雷特·乔丹的照片)

另请参阅:自动化中的道德:解决人工智能中偏见和顺从性的解决方案

博览会横幅,参与者将了解诸如模型幻觉等问题。

想进一步了解人工智能和行业领导者的大数据吗? 检查在阿姆斯特丹,加利福尼亚和伦敦举行的AI和大数据博览会。全面的活动以及其他领先活动,包括智力自动化会议,Blockx,一周的数字化转型和网络安全以及云博览会。

基于Techforge在此处探索企业技术和网络研讨会的其他事件。

Source link

Scroll to Top