题材相关新闻:
法国竞争监督机构今日对谷歌罚款2.5亿欧元,原因是谷歌在与媒体出版商的关系中违反了欧盟知识产权规则。监管机构称,谷歌的聊天机器人Bard(现名Gemini)在未通知的情况下使用出版商和新闻机构的内容进行了训练。这一定程度印证了版权的重要性。
题材介绍:
一、版权提供商与AI公司的合作是互利共赢
1、AI生成内容的快速增加,对于图片素材库、新闻出版社等版权提供商来说构成一定的威胁
1) AI生成内容可能被上传至版权库混淆视听。随着大模型性能的不断突破,AI生成内容的质量逐渐提升,甚至难以与人类作者和艺术家创作的内容区分。若版权素材库中被上传了大量的AI生成内容,可能会影响用户的付费意愿。
2) AI生成内容可能成为版权素材库的替代品。随着AIGC产品的推广和普及、未来大模型成本的不断降低,以及相关政策的不断完善,AI生成内容将被越来越多地运用于商业化产品中,从而挤压传统版权素材库的生存空间。
因此,版权提供商也需要积极拥抱 AIGC潮流,探索传统业务与AI技术结合的新形势
2、AI公司模型训练需要海量的高质量数据,且AIGC产品也需要与更多信息源产生联动
公开渠道的数据存在侵权的风险,且需要耗费更多精力进行数据清洗和数据标注,为了模型后续的商业化和公司的长期健康发展,从版权提供商获取高质量训练数据是更好的方式。
另外,版权提供商也可以丰富AIGC产品的信息来源和产品功能,赋能用户使用体验。
二、版权规定尚未完善,版权商有望提高估值
1、截至23年底,公众对于AI文生图和其他多模态生成的反感情绪仍较为强烈
2023年12月6日,春晚吉祥物“龙辰辰”被质疑是AI作图,受到了国内民众的广泛批评。自Stable Diffusion、Midjourney等文生图软件走入公众视野便引发了关于AI生成图片是否侵权的持续讨论。
22M12马里兰大学帕克分校和纽约大学合作发布的一篇论文显示,一些参数量较小的文生图模型会直接复制用于训练的图片素材的某个部分,而当时较为成熟的文生图产品StableDiffusion也出现了以像素点级别复制名画的细节、结构和绘画风格的情况。
2、公众对于 AI 多模态生成的质疑主要来自于
1)模型训练采用的图片素材是否获得授权;
2)通过机器学习生成图片是否可以被定义为学习和创作的过程;
3)AI生成图片过程中,运用于训练数据的图片素材是否被简单粗暴地拼接。
逐渐扭转公众对于 AI 多模态生成的消极情绪和片面认知,是AI图片、AI视频等技术推广至生产生活、释放商业化潜力的必要前提。
随着AIGC的影响力快速扩大,科技公司也需要付出更多成本以确保模型训练数据和生成内容的版权和合规性,以应对未来可能的法律挑战。
3、对 AIGC 的版权问题的争议和相关法规主要可以分为两类
1)AI生成内容的版权界定: 指由AI生成的文字、图片等内容是否受到版权保护,以及版权应当归属于用户、模型提供商、训练数据提供者等哪一方。对于AI生成内容版权的明确,是 AIGC产品大规模商业化的重要前提。
2)模型训练数据的版权规定: 指OpenAI、Stability AI等模型供应商在训练基础模型时采用的数据集是否受到版权保护,模型供应商应该以怎样的方式获得训练数据集的版权。
对于训练数据的版权规定,是AIGC产业良性可持续发展、以及令公众消除对AI生成内容的消极情绪的关键。