Adobe 在去年推出了其人工智能影像生成模型Firefly,宣称该 AI 模型主要使用 Adobe Stock 的数以亿计的授权图像进行训练。 Adobe 声称,Firefly 是一个相较于其他竞争对手,如 Midjourney,使用从互联网大量抓取图像训练的「商业安全」选择。 然而,背后实际上 Adobe 也部分依赖来自这些竞争对手的人工智能生成内容来训练 Firefly,这一点从未在众多关于 Firefly 安全性的公开发布和贴文中被明确提及。

AI 模型多用网上图训练
训练人工智能型号所需的大量数据正在受到越来越多的关注,尤其是在使用有版权的材料进行此过程中。 Midjourney、Dall-E 的开发者 OpenAI 和 Stable Diffusion 的制造商 Stability AI 等公司建立他们的媒体生成型号时,采取了从互联网搜集影像的做法,这引起了众多艺术家的愤怒和诉讼。 西安大略大学的助理教授 Luke Stark 表示,这揭示了「负责任的人工智能」定义的不明确性,也显示了摆脱法律或社会文化问题的困难。

Firefly 以 AI 生成图像训练引道德争议
尽管 Adobe 曾公开批评其他公司的资料搜集实践,但公司内部对于吸收人工智能生成影像到 Firefly 型号中的伦理和形象存在分歧。 有员工建议逐步淘汰这些生成影像,但据了解目前没有这样的计划。 Adobe 的高级副总裁 Ashley Still 在本月初一次《彭博》智库活动中提到,企业客户对 Adobe 的做法表示赞赏,因为他们不会像其他公司那样,在公开网络上窃取知识产权。

透明度问题
尽管 Adobe 在其网站和博客中强调只使用授权或公共领域的数据来训练 Firefly,但公司从未公开明确表示 Firefly 部分训练数据来自竞争对手的工具。 不过,Adobe 在运行的两个 讨论组中提到了这些细节,这些讨论组分别是 Adobe Stock 和专注于 Firefly 的讨论组。
