О том как иски писателей к OpenAI и Meta могут изменить концепцию авторского права.
Не так давно группа известных писателей подала в суд на OpenIA за “предположительно” неправомерное использование их книг при обучении LLM. Аналогичный иск подали также несколько комиков также против OpenIA и Meta.
Тут ссылка на сам иск. Кстати, обратите внимание на количество ответчиков. Вот уж где корпоративные юристы смогли оторваться, чтобы разграничить ответственность в группе компаний и распределить IPR.
LLM реагируют на запросы пользователя и буквально подбирают слова при генерации ответа, основываясь на огромном объеме данных, использованных при их обучении.
В настоящее время ни авторы, ни регуляторы, ни суд не знает на каких именно датасетах обучены (обучаются) такие LLM как ChapGPT или Llama. Хотя, про другие AI можно сказать то же самое.
Основной аргумент в иске, поданном авторами, сосредоточен на предполагаемом незаконном использовании материалов, защищенных авторским правом, для обучения моделей AI. Главное утверждение заключается в том, что использование авторских произведений в качестве обучающих данных само по себе является воспроизведением произведений.
OpenIA и Meta делают акцент на концепции fair use, считая ее основанием для потенциального использования материалов в обучении AI. Само собой, при этом никто открыто не заявляет, что использовал чьи-то произведения для обучения AI.
“Закон об авторском праве не защищает факты или синтаксическую, структурную и лингвистическую информацию, которая могла быть извлечена из таких книг, как книги Истцов, во время обучения”, — заявили адвокаты Meta. «Использование текстов для обучения Llama статистическому моделированию и созданию оригинальных выражений является преобразовательным по своей природе и является квинтэссенцией добросовестного использования».
Аналогичным образом, адвокаты, выступающие от имени OpenAI, заявили, что “чат-боты, управляемые искусственным интеллектом, такие как ChatGPT, представляют собой новое технологическое использование материалов, защищенных авторским правом, которое не нарушает закон.”
⁉️ Как данные иски могут изменить траекторию развития AI?
Если победят авторы, то разработчикам придется получать разрешение у авторов и издателей на использование их работ, т.е. заключать лицензионные соглашения и платить вознаграждение. В таком случае, текущая система останется неизменна.
А еще в этом случае у нас есть шанс заглянуть под капот ChatGPT или Llama…
Если победят разработчики LLM , то это фактически закрепит возможность скрыпить любые данные из Интернета для обучения AI. По сути это означает, что любой может создать AI модель и обучать ее практически на любых данных. Согласие авторов контента значения не имеет.
Тут стоит вспомнить также об открытых профилях в Instagram, блогах или YouTube…
Не так давно группа известных писателей подала в суд на OpenIA за “предположительно” неправомерное использование их книг при обучении LLM. Аналогичный иск подали также несколько комиков также против OpenIA и Meta.
Тут ссылка на сам иск. Кстати, обратите внимание на количество ответчиков. Вот уж где корпоративные юристы смогли оторваться, чтобы разграничить ответственность в группе компаний и распределить IPR.
LLM реагируют на запросы пользователя и буквально подбирают слова при генерации ответа, основываясь на огромном объеме данных, использованных при их обучении.
В настоящее время ни авторы, ни регуляторы, ни суд не знает на каких именно датасетах обучены (обучаются) такие LLM как ChapGPT или Llama. Хотя, про другие AI можно сказать то же самое.
Основной аргумент в иске, поданном авторами, сосредоточен на предполагаемом незаконном использовании материалов, защищенных авторским правом, для обучения моделей AI. Главное утверждение заключается в том, что использование авторских произведений в качестве обучающих данных само по себе является воспроизведением произведений.
OpenIA и Meta делают акцент на концепции fair use, считая ее основанием для потенциального использования материалов в обучении AI. Само собой, при этом никто открыто не заявляет, что использовал чьи-то произведения для обучения AI.
“Закон об авторском праве не защищает факты или синтаксическую, структурную и лингвистическую информацию, которая могла быть извлечена из таких книг, как книги Истцов, во время обучения”, — заявили адвокаты Meta. «Использование текстов для обучения Llama статистическому моделированию и созданию оригинальных выражений является преобразовательным по своей природе и является квинтэссенцией добросовестного использования».
Аналогичным образом, адвокаты, выступающие от имени OpenAI, заявили, что “чат-боты, управляемые искусственным интеллектом, такие как ChatGPT, представляют собой новое технологическое использование материалов, защищенных авторским правом, которое не нарушает закон.”
⁉️ Как данные иски могут изменить траекторию развития AI?
Если победят авторы, то разработчикам придется получать разрешение у авторов и издателей на использование их работ, т.е. заключать лицензионные соглашения и платить вознаграждение. В таком случае, текущая система останется неизменна.
А еще в этом случае у нас есть шанс заглянуть под капот ChatGPT или Llama…
Если победят разработчики LLM , то это фактически закрепит возможность скрыпить любые данные из Интернета для обучения AI. По сути это означает, что любой может создать AI модель и обучать ее практически на любых данных. Согласие авторов контента значения не имеет.
Тут стоит вспомнить также об открытых профилях в Instagram, блогах или YouTube…