
В недавнем решении по делу Getty Images v Stability AI Высокий суд Великобритании отклонил претензию Getty о вторичном нарушении авторских прав, указав, что «воспроизводящая копия» в контексте вторичного нарушения должна быть именно «копией», и что модель Stable Diffusion якобы никогда не содержала и не хранила копий работ Getty. В то же время 11 ноября региональный суд Мюнхена в деле GEMA v OpenAI пришёл к иному выводу, указав, что модель может содержать копии, если произведение «запомнено» моделью. Оба решения не являются окончательными и подчёркивают отсутствие технического и международного консенсуса по этим вопросам.
Решение по делу GEMA также предупреждает о рисках широкого использования коммерческими разработчиками ИИ положений об исключениях для текстового и дата-майнинга (TDM). Подобная точка зрения поддерживается недавним аналитическим докладом, подготовленным по заказу профильного комитета Европейского парламента.
В этой заметке акцент делается на выводах немецкого суда по вопросам запоминания данных моделями и на трактовке объёма исключения TDM, предусмотренного статьёй 4 Директивы ЕС 2019 года об авторском праве в цифровом едином рынке.
GEMA — немецкое общество по сбору вознаграждений за музыкальные произведения. В конце прошлого года оно подало иск к OpenAI, утверждая, что ChatGPT воспроизводил тексты песен ряда его участников как внутри модели (в результате запоминания), так и при выдаче ответов на простые пользовательские запросы.
OpenAI отрицала наличие «запоминания» и хранения текстов в модели и утверждала, что копирование якобы подпадает под немецкую реализацию исключения TDM. Компания также отвергла ответственность за отдельные выводы модели, возлагая её на пользователей.
Региональный суд Мюнхена в основном встал на сторону GEMA. Суд признал, что некоторые тексты песен были «запомнены» и воспроизводимо содержались в ChatGPT, что привело к нарушению прав.
Суд также постановил, что исключение TDM применимо к первоначальным подготовительным работам по формированию обучающей выборки, но запоминание и воспроизведение текстов в весах модели выходят за рамки типичных задач текстового и дата-майнинга и затрагивают законные интересы правообладателей. Кроме того, суд отклонил аргумент о том, что ответственность должна нести исключительно пользователь, указав, что при простых запросах результат существенно определяется архитектурой модели и выбором обучающих данных.
В юридических и технических кругах возросли споры о двух ключевых вопросах: следует ли считать, что модели содержат «копии» исходных данных в смысле права, и применимо ли исключение TDM к обучению генеративных моделей. Решения в делах Getty и GEMA демонстрируют разные подходы, однако обе являются решениями первой инстанции, в них рассматривались разные модели и разные правовые аргументы, поэтому делать обобщённые выводы преждевременно.
Позиция мюнхенского суда во многом совпадает с оценкой, согласно которой исключение TDM предназначено для извлечения паттернов и аналитики из данных, тогда как обучение и использование генеративного ИИ связано с синтетической рекомбинацией данных для создания нового контента. В случае подтверждения такая интерпретация снизит значимость TDM как универсального правового основания для обучения коммерческих ИИ-систем.
Наблюдать за развитием этого правового поля важно и дальше: ожидается дальнейшая практическая и судебная проработка вопросов как на национальном уровне, так и в рамках Суда Европейского союза в делах, затрагивающих схожие правовые вопросы, включая ряд текущих споров в Германии, Франции и на уровне ЕС.


Комментариев