报告称Tumblr所有者正在与OpenAI和Midjourney就训练数据达成协议
404Media的一份报告称,Tumblr和WordPress.com的所有者正在与人工智能公司Midjourney和OpenAI进行谈判,以提供从用户帖子中抓取的训练数据。这份来自公司内部匿名消息人士的报告称,Automattic与两家人工智能公司之间的交易“迫在眉睫”。过去一周,Tumblr上流传着一些模糊的谣言,暗示与Midjourney的交易可能会为该网站带来新的收入来源。
根据404的报告,Automattic计划在周三推出一项新设置,“允许用户选择不与包括人工智能公司在内的第三方共享数据”。但它引用的内部帖子表明,该公司抓取了一份“初始数据转储”,其中包含“2014年至2023年间Tumblr的所有公开帖子内容”,其中包括(显然是错误的)不会在博客上公开可见的内容。目前尚不清楚这些数据做了什么,以及哪些数据(如果有)已发送到Midjourney和OpenAI。
OpenAI和Midjourney没有立即回应TheVerge的置评请求。Automattic向我们介绍了周二在404报告之后发布的一份公开声明。这篇题为“保护用户选择”的帖子暗示了与未具名的人工智能公司的合作关系。“我们目前默认阻止主要的人工智能平台爬虫——包括来自最大科技公司的爬虫——并在新爬虫发布时更新我们的列表,”它说,并且“将只分享WordPress.com和Tumblr上托管的公共内容尚未选择退出的网站。”它还指出,“我们还直接与选定的人工智能公司合作,只要他们的计划符合我们社区关心的问题:归因、选择退出和控制。”
许多公司已与人工智能工具制造商达成协议,提供培训数据——这些数据历来都是从公开的在线数据中获取的,近年来,这一过程的法律风险变得越来越大。据报道,Reddit与Google签订了每年6000万美元的协议,而Shutterstock则与OpenAI签署了一项协议,以对其照片库进行培训。但一些艺术家和作家——换句话说,Tumblr特别迎合的创意社区——抗议他们的作品被用于培训。公司一直在努力平衡满足用户和尝试新的人工智能工具之间的界限,导致像DeviantArt这样与该技术打交道的在线空间遭到强烈反对。
目前,关于任何交易将涉及什么,以及Automattic将从中获得多少收益,还没有太多信息。该公司拥有长期的网络托管业务WordPress.com和WordPressVIP,两者均基于开源WordPress软件构建。但该公司在2019年从Verizon手中收购的Tumblr货币化方面遇到了各种困难,并于去年宣布将缩减对该网站的雄心。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢。