Копирует ли искусственный интеллект код - судебный иск говорит, что нет

Беспокоимся ли мы о помощниках ИИ? Некоторые из нас были обеспокоены и оскорблены настолько, что обратились в суд на GitHub, Microsoft и Open AI по поводу копирования кода GitHub Copilot. Но судья встал на сторону ИИ. Почему?

Проблема в том, что когда вам помогает ИИ-помощник, всегда есть шанс, что вы узнаете код. Украл ли он этот код у вас или у другого разработчика?

Чтобы вы не увидели код, идентичный коду в обучающих данных, GitHub ввел фильтр обнаружения дублирования, который отсеивает все предложения кода, идентичного публичному коду на GitHub. Нейронные сети иногда запоминают что-то в своих обучающих данных, но это обычно считается примером "чрезмерной подгонки" и того, чего следует избегать. Тем не менее, учитывая размер используемых сетей, некоторого перебора можно ожидать.

Группа людей настолько обеспокоена законностью копирования кода с GitHub Copilot, что начала судебное разбирательство. Мы никогда не узнаем личности этих людей, поскольку они обозначены как истцы "Доу", что является юридическим механизмом, позволяющим сохранить их имена в тайне в судебных документах. Ответчиками по делу выступают GitHub Inc, а также корпорации Microsoft и OpenAI Inc.

ИИ, ставший предметом этого иска, действительно обучался на общедоступном коде на GitHub, большая часть которого не только бесплатна для просмотра, но и является открытым исходным кодом под той или иной лицензией. Можно утверждать, что это добросовестное использование, но также можно утверждать, что это кража авторских прав. Теперь аргумент заключается в том, что тот факт, что на GitHub есть фильтр дубликатов, означает, что пользователь может отключить его и, следовательно, получать в ответах материалы, защищенные авторским правом.

Иск был отклонен с упреком, то есть не может быть подан повторно, из-за того, что, по мнению судьи, большинство предложений Copilot недостаточно близки к оригинальному коду в обучающих данных. Неспособность истцов предоставить примеры копирования, похоже, лежит в основе этого заключения и идеи о том, что наличие дублирующего фильтра не является доказательством того, что дубликаты имеют место. Цитируем постановление суда:

"они не объясняют, как инструмент делает правдоподобным то, что Copilot действительно будет делать это в ходе своей нормальной работы, или как любые такие стенографические выводы могут быть чем-то большим, чем короткие и обычные шаблонные функции".

Вот это упоминание о шаблонных функциях - пища для размышлений.

Разве большинство кода не является в каком-то смысле "шаблонным"?

В общем, мы не говорим о коде, реализующем какой-то новый умный алгоритм, который вы только что изобрели. Большая часть сложного кода, написанного сегодня, - это просто попытка понять документацию других систем кода. Обычно происходит так: вы садитесь за стол с намерением реализовать что-то, и вам приходится разбираться с тем, что говорит вам документация, и составлять некоторые вызовы функций или использование объектов, чтобы заставить их работать.

Обычно это нелегко, потому что документация очень скудная, многие из нас очень плохо умеют читать и понимать принципы, лежащие в основе прочитанного, и у нас мало интуиции, чтобы понять, как все это может работать. В результате мы сражаемся с документацией, пытаясь создать что-то работающее. Мы должны правильно вызывать функции, и это кажется ракетостроением. Но когда это сделано, у нас есть нечто повторяющееся. Мы победили документацию и заставили ее работать - ура! Но на самом деле мы имеем некий шаблонный код, который можно повторно использовать для выполнения той же работы, не прибегая к повторному сражению. Это не авторский материал, поскольку он не обладает оригинальностью выражения и не претендует на уникальность.

Учитывая результаты дела Oracle против Google и мое личное мнение, я не думаю, что код может быть объектом авторского права, и, как следствие, я не думаю, что нам следует подавать в суд на агентов ИИ, которые делают то же, что и мы все, - принимают шаблонный код как должное.

Что может быть достойно защиты интеллектуальной собственности, так это нечто сродни "внешнему виду и атмосфере" - пользовательский интерфейс или даже API могут быть объектами авторского права в некотором расширенном смысле, но не код, который их использует, даже если они были получены с большим трудом и, следовательно, имеют инвестиционную ценность.

На этом история не заканчивается. Дело переходит к решению вопроса о том, нарушил ли Copilot какие-либо лицензионные условия - это гораздо более сложное решение. Если прецедент Oracle против Google в отношении Android является чем-то из ряда вон выходящим, это дело может затянуться на годы.

Копирует ли искусственный интеллект код - судебный иск говорит, что нетКопирует ли искусственный интеллект код - судебный иск говорит, что нет
Понравилась новость? Тогда не забудь оставить свой комментарий.
А так же, добавь наш сайт в закладки (нажми Ctrl+D), не теряй нас.
10 июля 2024 г.
59
Теги: ИИ , GitHub , Microsoft , Open AI , Copilot

Комментарии

Оставить комментарий:
* отправляя форму, я даю согласие на обработку персональных данных

Читайте еще

Продолжаем добавлять языки программирования для Вас.
Впереди много интересного!

Только свежие новости программирования и технологий каждый день.