报告称Tumblr所有者正在与OpenAI和Midjourney就训练数据达成协议

2024-02-29 10:45:38

导读 404Media的一份报告称，Tumblr和WordPress com的所有者正在与人工智能公司Midjourney和OpenAI进行谈判，以提供从用户帖子中抓取的训练数据

404Media的一份报告称，Tumblr和WordPress.com的所有者正在与人工智能公司Midjourney和OpenAI进行谈判，以提供从用户帖子中抓取的训练数据。这份来自公司内部匿名消息人士的报告称，Automattic与两家人工智能公司之间的交易“迫在眉睫”。过去一周，Tumblr上流传着一些模糊的谣言，暗示与Midjourney的交易可能会为该网站带来新的收入来源。

根据404的报告，Automattic计划在周三推出一项新设置，“允许用户选择不与包括人工智能公司在内的第三方共享数据”。但它引用的内部帖子表明，该公司抓取了一份“初始数据转储”，其中包含“2014年至2023年间Tumblr的所有公开帖子内容”，其中包括(显然是错误的)不会在博客上公开可见的内容。目前尚不清楚这些数据做了什么，以及哪些数据(如果有)已发送到Midjourney和OpenAI。

OpenAI和Midjourney没有立即回应TheVerge的置评请求。Automattic向我们介绍了周二在404报告之后发布的一份公开声明。这篇题为“保护用户选择”的帖子暗示了与未具名的人工智能公司的合作关系。“我们目前默认阻止主要的人工智能平台爬虫——包括来自最大科技公司的爬虫——并在新爬虫发布时更新我们的列表，”它说，并且“将只分享WordPress.com和Tumblr上托管的公共内容尚未选择退出的网站。”它还指出，“我们还直接与选定的人工智能公司合作，只要他们的计划符合我们社区关心的问题：归因、选择退出和控制。”

许多公司已与人工智能工具制造商达成协议，提供培训数据——这些数据历来都是从公开的在线数据中获取的，近年来，这一过程的法律风险变得越来越大。据报道，Reddit与Google签订了每年6000万美元的协议，而Shutterstock则与OpenAI签署了一项协议，以对其照片库进行培训。但一些艺术家和作家——换句话说，Tumblr特别迎合的创意社区——抗议他们的作品被用于培训。公司一直在努力平衡满足用户和尝试新的人工智能工具之间的界限，导致像DeviantArt这样与该技术打交道的在线空间遭到强烈反对。

目前，关于任何交易将涉及什么，以及Automattic将从中获得多少收益，还没有太多信息。该公司拥有长期的网络托管业务WordPress.com和WordPressVIP，两者均基于开源WordPress软件构建。但该公司在2019年从Verizon手中收购的Tumblr货币化方面遇到了各种困难，并于去年宣布将缩减对该网站的雄心。

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时候联系我们修改或删除，多谢。

标签：

上一篇:车辆管理（关于车辆管理的介绍）

下一篇:Chrome现在会在扩展程序存在危险时通知您

报告称Tumblr所有者正在与OpenAI和Midjourney就训练数据达成协议

猜你喜欢

最新文章