Засновник Midjourney Девід Хольц про вплив ШІ на мистецтво, уяву та креативну економіку

Серед подорожі є одним із провідних двигунів нової технології використання штучного інтелекту (ШІ) для створення візуальних образів із текстових підказок. Стартап, що базується в Сан-Франциско, нещодавно потрапив у новини як двигун, що стоїть за твором мистецтва, який отримав нагороду на чесному конкурсі штату Колорадо, і це навряд чи буде останньою складною проблемою, з якою мистецтво ШІ зіткнеться в найближчі роки.

Midjourney вирізняється з-поміж інших у просторі, підкреслюючи художню естетику в образах, які він створює. Платформа не намагається створювати фотореалістичні зображення, які можна було б помилково прийняти за фотографії, і генеральний директор Девід Хольц каже, що його особисто дуже хвилює неймовірна якість дипфейків та іншої роботи, яка занадто точно імітує реальність. Замість цього Хольц каже, що Midjourney створено для того, щоб розкрити креативність звичайних людей, даючи їм інструменти для створення красивих фотографій, просто описуючи їх.

Але, незважаючи на гуманістичний, споживчий фокус компанії, неминуче виникають запитання щодо наслідків для комерційного мистецтва та професійних художників. Я брав інтерв’ю у Хольца для a ширший матеріал про потенційні порушення, які штучний інтелект може спричинити у створенні зображень для розваг, відеоігор і видавництва. Ось довший уривок із нашої розмови, де Хольц надає більше глибини та контексту, коли він розглядає ці проблеми та пояснює своє бачення компанії, галузі та технології. Інтерв’ю було відредаговано для тривалості та чіткості.

Роб Сальковіц, співавтор Forbes: Яка твоя роль і титул?

Девід Хольц, Midjourney. Я засновник і генеральний директор. Хоча зазвичай я просто віддаю перевагу тому, щоб мене називали засновником, оскільки генеральний директор звучить дуже ділово, а ми не дуже ділові. Ми — лабораторія прикладних досліджень, яка створює продукти.

Яка місія Midjourney?

Нам подобається говорити, що ми намагаємося розширити здатність уяви людського роду. Мета полягає в тому, щоб зробити людей більш уявними, а не створювати уявні машини, що, на мою думку, є важливою відмінністю.

Чи можете ви коротко описати історію компанії на сьогодні?

Ми почали працювати над частиною уяви нашої компанії близько півтора років тому. Були деякі прориви в моделях дифузії, люди розуміли кліп, відкритий штучний інтелект тощо. Майже всі, хто бере участь у цьому, є Сан-Франциско, і ми всі зрозуміли, що це стане серйозним, що воно відрізняється від багатьох інших речей.

У чому Midjourney вважає переваги цієї технології перетворення тексту в зображення для бізнесу та суспільства?

Мене, безумовно, більше хвилює суспільство, ніж бізнес. Ми споживчий продукт, але, можливо, 30%-50% наших користувачів зараз є професіоналами. Більшість ні. Митці на платформі кажуть нам, що це дозволяє їм бути більш креативними та дослідницькими на початку, придумуючи багато ідей за короткий проміжок часу.

Прямо зараз наші професійні користувачі використовують платформу для розробки концепцій. Найважча частина [комерційного арт-проекту] часто буває на початку, коли зацікавлена ​​сторона не знає, чого хоче, і має побачити деякі ідеї, на які можна реагувати. Midjourney може допомогти людям набагато швидше досягти бажаної ідеї, оскільки повторення цих концепцій дуже трудомістке.

Ще одна перевага для митців полягає в тому, що це дає людям впевненість у сферах, у яких вони не впевнені. Більшість, якщо не всі митці, відчувають, що є частина мистецтва, яку вони не можуть робити добре. Це можуть бути кольори, композиція, фон. У нас є відомий дизайнер персонажів, який використовує наш продукт, і люди запитують його, навіщо вам використовувати штучний інтелект, якщо ви вже такі хороші. І він сказав: «Ну, я хороший лише в ролі характеру. Це допомагає мені з рештою, світом, фоном, кольоровими схемами».

Приблизно скільки людей користується продуктом?

Мільйони користуються ним. Наш Discord перевищує два мільйони. На даний момент це найбільший активний сервер Discord.

Чи дозволяє ліцензія Midjourney комерційне використання зображень, створених платформою?

Так. Але якщо ви працюєте в компанії з річним доходом понад мільйон доларів, ми просимо вас придбати корпоративну ліцензію.

Як було створено набір даних?

Це просто велика подряпина Інтернету. Ми використовуємо опубліковані набори відкритих даних і навчаємося на них. І я б сказав, що це те, що роблять 100% людей. Ми не були вибагливими. Наука дійсно швидко розвивається з точки зору того, скільки даних вам дійсно потрібно, порівняно з якістю моделі. Знадобиться кілька років, щоб справді зрозуміти речі, і до того часу у вас можуть бути моделі, яких ви майже нічого не тренуєте. Ніхто насправді не знає, що вони можуть зробити.

Ви шукали згоди у живих художників чи працюєте, все ще захищені авторським правом?

Ні. Насправді немає способу отримати сто мільйонів зображень і знати, звідки вони. Було б круто, якби зображення містили в них метадані про власника авторських прав чи щось подібне. Але це не річ; немає реєстру. Немає способу знайти зображення в Інтернеті, а потім автоматично відстежити його власника, а потім мати будь-який спосіб зробити будь-що, щоб автентифікувати його.

Чи можуть художники відмовитися від включення у вашу модель навчання даних?

Ми дивимось на це. Завдання зараз полягає в тому, щоб з’ясувати, які правила, і як зрозуміти, чи людина справді є художником певного твору чи просто вказує на нього своє ім’я. Ми не зустрічали нікого, хто хотів би вилучити своє ім’я з набору даних.

Чи можуть артисти відмовитися від вказівок у підказках?

Не зараз. Ми дивимось на це. Знову ж таки, нам доведеться знайти спосіб автентифікації цих запитів, що може бути складним.

Що ви скажете комерційним артистам, які стурбовані тим, що це знищить їхні засоби до існування? Навіщо арт-директору в певний момент наймати ілюстратора для створення таких робіт, як концепт-арт, постановочний дизайн, фони – такі речі, – коли вони можуть просто вводити підказки та отримувати корисні результати набагато швидше та за набагато менших витрат?

Це ще багато роботи. Це не просто «зробіть мені фон». Це може бути вдесятеро менше роботи, але це набагато більше, ніж збирається виконати менеджер.

Я думаю, що це може піти двома шляхами. Один із способів — спробувати надати той самий рівень вмісту, який споживають люди, за нижчою ціною, чи не так? І інший спосіб зробити це – створити надзвичайно кращий вміст за цінами, які ми вже готові витратити. Я вважаю, що більшість людей, якщо вони вже витрачають гроші, а у вас є вибір між неймовірно кращим або дешевшим контентом, насправді обирають надзвичайно кращий контент. Ринок уже встановив ціну, яку люди готові платити.

Я думаю, що дехто спробує вирізати артистів. Вони спробують зробити щось подібне з меншою ціною, і я думаю, що вони проваляться на ринку. Я думаю, що ринок рухатиметься до вищої якості, більше креативності та значно більш витонченого, різноманітного та глибокого контенту. І виграють ті люди, які справді вміють використовувати, як художники, і використовують інструменти для цього.

Ці технології насправді створюють набагато глибше сприйняття та грамотність у візуальному середовищі. У вас справді може бути попит, ви перевищите здатність продюсувати на такому рівні, і тоді, можливо, ви справді підвищите зарплату артистам. Це може бути дивно, але це те, що станеться. Швидке зростання попиту як на якість, так і на різноманітність призведе до створення чудових і несподіваних проектів.

Покоління студентів закінчило мистецькі школи, багато з них у великих боргах, розраховуючи на відносно добре оплачувану роботу у виробництві розваг, відеоігор, комерційному мистецтві тощо. Як поява платформ ШІ для перетворення тексту в зображення впливає на їх майбутнє?

Думаю, хтось намагатиметься скоротити витрати, а хтось – розширювати амбіції. Я думаю, що люди, які розширюють амбіції, все ще будуть платити ті самі зарплати, а люди, які намагаються скоротити витрати, я думаю, зазнають невдачі.

Штучний інтелект зазвичай використовується в масштабах для таких речей, як кол-центри або перевірка багажу в аеропортах, а також для роботи, яку люди насправді не хочуть виконувати. І ціннісна пропозиція полягає в тому, що це звільняє людей для виконання більш корисної та цікавішої роботи. Але мистецька робота є корисною та цікавою. Люди працюють усе своє життя та розвивають свої навички, щоб отримати таку роботу. Чому ви вказуєте на цю технологію на тому рівні економіки як на бізнес-центр і пріоритет для того, що ви робите?

Особисто я ні. Мої речі не створені для професійних художників. Якщо їм подобається це використовувати, то це чудово. Мої речі створені для схожих людей, які, наприклад, є одна жінка в Гонконзі, і вона прийшла до мене, і вона каже: «Єдина річ у Гонконзі, якою твої батьки ніколи не хочуть, щоб ти був, це художник, і я м зараз банкір. Я живу хорошим банкірським життям. Але з Midjourney тепер я фактично починаю відчувати смак цього досвіду бути людиною, якою я насправді хотів бути». Або хлопець на зупинці для вантажівок, який робить власні бейсбольні картки з дикими зображеннями, просто для розваги. Це створено для цих людей, тому що, як і більшість людей, вони ніколи не можуть робити це.

Важливо підкреслити, що мова не йде про мистецтво. Це про уяву. Уява іноді використовується для мистецтва, але часто це не так. Більшість зображень, створених на Midjourney, не використовуються професійно. Ними навіть не діляться. Їх просто використовують для цих інших цілей, для цих самих людських потреб.

Тим не менш, результатом вашого продукту є зображення, які мають комерційну цінність у професійному контексті на додаток до всіх цих інших властивостей. І це дуже руйнує цю економіку.

Я думаю, що ми робимо човен, і хтось може брати участь у перегонах на цьому човні, але це не означає, що човен призначений для перегонів. Якщо ви використовуєте човен для перегонів, тоді, можливо, так, звичайно. У той момент це так. Але людська сторона дійсно має значення, і я думаю, що ми не... Ми хочемо, щоб фотографії виглядали красиво. Ми не сприймаємо себе як частину нашої справи, намагаючись створити мистецтво. Ми хочемо, щоб світ був більш уявним. Ми воліємо робити красиві речі, ніж потворні речі.

Чи вважаєте ви, що будь-який державний орган має юрисдикцію чи повноваження регулювати цю технологію? І якщо так, як ви вважаєте, вони повинні?

Не знаю. Регулювання цікаве. Ви повинні збалансувати свободу робити щось зі свободою бути захищеним. Проблема не в самій технології. Це як вода. Вода може бути небезпечною, в ній можна потонути. Але це теж важливо. Ми не хочемо забороняти воду лише для того, щоб уникнути небезпечних частин.

Ну, ми хочемо бути впевненими, що наша вода чиста.

Так, це правда.

Джерело: https://www.forbes.com/sites/robsalkowitz/2022/09/16/midjourney-founder-david-holz-on-the-impact-of-ai-on-art-imagination-and-the- креатив-економіка/