«Не розповідати всю історію»: OpenAI оскаржує позови NYT щодо авторських прав

У відповідь на позов твін New York Times, у якому інформаційне видання звинуватило OpenAI у використанні його новинного контенту для навчання своєї моделі штучного інтелекту, OpenAI надав квитанції. Провідний розробник штучного інтелекту схилявся до своєї часто декларованої прихильності індустрії новин, заявивши: «Ми підтримуємо журналістику, співпрацюємо з новинними організаціями та віримо The New York Times позов безпідставний».

OpenAI також звинуватив Нью-Йорк Таймс неповної звітності, стверджуючи, що « Нью-Йорк Таймс не розповідає всю історію». Компанія припускає, що приклади, використані газетою, походять із старих статей, які широко доступні на сторонніх веб-сайтах, а також натякнули, що Нью-Йорк Час розробив підказки штучного інтелекту, щоб створити найпроклятіші докази.

«Схоже, вони навмисно маніпулювали підказками, часто включаючи довгі уривки статей, щоб змусити нашу модель відригувати», — сказав OpenAI, маючи на увазі, що Нью-Йорк Таймс діяв недобросовісно, надаючи неприродні підказки як докази.

«Навіть якщо ми використовуємо такі підказки, наші моделі зазвичай не поводяться так Нью-Йорк Таймс натякає, що свідчить про те, що вони або наказали моделі відригувати, або вибрали свої приклади з багатьох спроб».

Оперативна маніпуляція — це поширена практика, коли люди можуть обманом змусити модель штучного інтелекту виконувати те, на що вона не запрограмована, використовуючи конкретні підказки, які викликають дуже конкретну відповідь, яка не була б отримана за нормальних умов.

OpenAI підкреслив свою співпрацю з індустрією новин.

«Ми наполегливо працюємо над нашим технологічним процесом розробки, щоб підтримати новинні організації», — написала компанія, підкресливши розгортання інструментів штучного інтелекту, які допомагають репортерам і редакторам, а також мету спільного розвитку ШІ та журналістики. OpenAI нещодавно уклав партнерські відносини з Axel Springer — видавцем Перекотиполе-щоб надавати точніші підсумки новин.

Вирішуючи проблему «регургітації» вмісту, як Нью-Йорк Таймс Як стверджується, OpenAI визнає, що це рідкісна, але існуюча проблема, яку вони працюють над пом’якшенням.

«Запам’ятовування — це рідкісна помилка процесу навчання, у якому ми постійно вдосконалюємося», — пояснюють вони та захищають свої методи навчання. «Навчання моделей ШІ за допомогою загальнодоступних інтернет-матеріалів є добросовісним використанням».

Незважаючи на це, OpenAI визнав обґрунтованість етичних міркувань, забезпечивши процес відмови для видавців.

Навчання ШІ та зберігання контенту

Боротьба між творцями контенту та компаніями штучного інтелекту наразі здається грою з нульовою сумою, оскільки корінням усього є фундаментальний спосіб навчання моделей штучного інтелекту.

Ці моделі розроблено з використанням величезних наборів даних, що містять тексти з різних джерел, включаючи книги, веб-сайти та статті. Інші моделі використовують картини, ілюстрації, фільми, голоси та пісні, залежно від того, чому вони навчені створювати. Однак ці моделі не зберігають певні статті чи дані. Натомість вони аналізують ці матеріали, щоб вивчити мовні моделі та структури.

Цей процес має вирішальне значення для розуміння природи звинувачень і захисту OpenAI, а також для розуміння того, чому тренери зі штучного інтелекту вважають, що їхні підприємства використовують контент чесно — подібно до того, як студент мистецтва вивчає іншого художника або стиль мистецтва, щоб зрозуміти його характеристики.

Однак творці, зокрема Нью-Йорк Таймс і автори бестселерів — стверджують, що такі компанії, як OpenAI, недобросовісно використовують їхній вміст. Вони стверджують, що їхня інтелектуальна власність використовується без дозволу чи компенсації, що призводить до створення продуктів штучного інтелекту, які потенційно можуть конкурувати з їхнім оригінальним вмістом і відвернути аудиторію.

Команда Нью-Йорк Таймс подали до суду на OpenAI, заявивши, що використання їх вмісту без явного дозволу підриває цінність оригінальної журналістики, підкреслюючи потенційний негативний вплив на виробництво незалежної журналістики та її вартість для суспільства. І, можна сперечатися, незалежно від того, наскільки детальним був запит, якщо він «вигадав» будь-який захищений авторським правом вміст, це тому, що він був використаний.

Справедливе чи нечесне використання має вирішувати суд.

Ця судова битва є частиною правового руху, який може сформувати майбутнє ШІ, законів про авторське право та журналістики. У міру розвитку справи це, безсумнівно, вплине на дискусію навколо інтеграції ШІ у створення контенту та прав власників інтелектуальної власності в цифрову еру.

Проте OpenAI не вважає, що це сценарій з нульовою сумою. Незважаючи на критику ключових моментів позову, компанія Альтмана заявила, що готова простягнути оливкову гілку та знайти позитивний результат десь.

«Ми сподіваємося на конструктивне партнерство з Нью-Йорк Таймс і поважати його довгу історію, яка включає повідомлення про першу працюючу нейронну мережу понад 60 років тому та відстоювання свобод Першої поправки».

Під редакцією Райана Озави.

Будьте в курсі криптовалютних новин, отримуйте щоденні оновлення на свою поштову скриньку.

Джерело: https://decrypt.co/212077/not-telling-the-full-story-openai-challenges-nyts-copyright-lawsuit-claims