На прошлой неделе технологические гиганты добились нескольких важных побед в судах США по делам о правомерности использования защищенных авторским правом текстов для обучения ИИ
Американский судья постановил, что компания Anthropic, разработчик чат-бота Claude, не нарушила закон, используя книги без разрешения авторов для обучения своей модели. Судья Уильям Олсап сравнил подход Anthropic с «читателем, который стремится стать писателем».
Уже на следующий день Meta* также получила решение в свою пользу: окружной судья Сан-Франциско Винс Чабрия решил, что истцы не доказали, что ИИ Meta* создаст «размывание рынка», заполнив его схожими работами.
В тот же день группа писателей подала иск против Microsoft, обвинив компанию в нарушении авторских прав при создании генератора текста Megatron. Учитывая решения по делам Meta* и Anthropic, авторам предстоит непростая борьба, считают эксперты.
Эти три процесса — лишь отдельные эпизоды в более широкой юридической «войне» вокруг авторских прав на контент для обучения ИИ. Несколько недель назад Disney и NBC Universal подали в суд на компанию Midjourney, обвинив ее генератор изображений и планируемый видеогенератор в незаконном использовании культовых персонажей: Дарт Вейдера и семью Симпсонов.
Крупнейшие звукозаписывающие лейблы мира — Sony, Universal и Warner — также подали иски против разработчиков музыкальных ИИ Suno и Udio. На фронте текстов продолжается громкий процесс газеты New York Times против OpenAI и Microsoft.
Любопытный и показательный факт всплыл в ходе разбирательства по Anthropic: компания собрала около 7 миллионов пиратских книг для создания своей базы данных. Компания купила эти книги в бумажном виде, отсканировала текст, а затем уничтожила оригиналы, чтобы формально «исправить» ситуацию. Ars Technica пишет, что книги были буквально нарезаны и выброшены после оцифровки. Существуют более щадящие методы сканирования, но они медленнее, а индустрия ИИ настроена «действовать быстро и ломать устои».
*— запрещена в России