Чи вдасться Ілону Маску розробити генеративну підробку AI ChatGPT «TruthGPT», яка завжди буде стоїчно правдивою, запитує етику штучного інтелекту та законодавство щодо штучного інтелекту

У двері каюти стукають.

Нам відкрити двері?

У фільмах зазвичай стверджується, що ми не повинні дозволяти нашій цікавості взяти верх над нами, а саме ми абсолютно ніколи не повинні відкривати двері. З огляду на це, рішення залишити двері зачиненими, здається, не стане гідною історією. Здається, нас тягне до хвилювання та невідомого.

Отже, давайте відкриємо двері.

У цьому конкретному випадку я маю на увазі якийсь безлад у сфері штучного інтелекту (ШІ), який віщує або хороші, або найгірші часи для всіх нас. Ця ситуація потенційно тягне за собою майбутнє ШІ. І можна було б урочисто припустити, що майбутнє штучного інтелекту охоплює досить драматичні наслідки, включаючи нібито формування майбутнього суспільства та долі людства.

Ось така угода.

Згідно з останніми новинами, Ілон Маск, часом найбагатша людина у світі, шукає першокласних дослідників штучного інтелекту, щоб приєднатися до нового підприємства штучного інтелекту, яке він має на увазі. Тихо звертаються до різних розробників ШІ та вчених ШІ. Стукіт у їхні двері, очевидно, дає великі обіцянки та потенційно прибуткові новини.

Передбачувана суть ініціативи штучного інтелекту, яка ще не розкрита, є копією широко популярного ChatGPT, який був випущений OpenAI ще в листопаді. Ви майже напевно чули або бачили гучні заголовки про ChatGPT. Ненадовго я докладніше поясню, що таке ChatGPT. Ви також повинні знати, що ChatGPT є прикладом типу ШІ, відомого як Генеративний ШІ. Сьогодні існує багато генеративних програм ШІ. ChatGPT має найвищий публічний авторитет і, здається, відомий усім, навіть, можливо, тим, хто якимось чином живе в печері.

Ось приклад репортажів про цю напівсекретну сагу, яка швидко розвивається:

  • «Останніми тижнями Ілон Маск звернувся до дослідників штучного інтелекту щодо створення нової дослідницької лабораторії для розробки альтернативи ChatGPT, високопрофільного чат-бота, створеного стартапом OpenAI, за словами двох людей, які безпосередньо знайомі з зусиллями, і третьої особи, проінформованої про це. на розмови» (Інформація, «Боротьба з «розбудженим ШІ», Маск набирає команду для розробки конкурента OpenAI», Джон Віктор і Джессіка Е. Лессін, 27 лютого 2023 р.).

Ваша перша думка може бути такою, що якщо Ілон Маск хоче створити підробку ChatGPT, це залежить від нього та того, як він хоче витратити свої гроші. Удачі. Він просто доповнить уже існуючу та дедалі більшу кількість генеративних програм ШІ. Можливо, він заробить додаткові статки на своїй власній версії ChatGPT. Або, можливо, це буде великий гул, і крихітна вм’ятина в його величезному багатстві від скромно дорогої гонитви буде схожа на помилку округлення в бухгалтерії.

Замість потужного стуку в двері, мабуть, це більше схоже на скромне стук-стук у двері.

Будьте готові до повороту.

Вважається, що Ілон Маск хоче похитнути основу сучасних генеративних програм ШІ та відтворити деякі важливі аспекти того, як вони працюють і що вони виробляють. Як я коротко поясню, поширеним і чесним сумнівом щодо сучасного генеративного ШІ є те, що він може генерувати помилки, неправду та так звані галюцинації ШІ. Кожен, хто користувався генеративним штучним інтелектом, безсумнівно, стикався з цими проблемами. Очевидно, Ілон Маск сподівається скоротити та, можливо, якось усунути подібні аномалії та проблемні схильності.

Це справді схоже на вартісне й почесне прагнення. Насправді, будь ласка, майте на увазі, що майже чи, можливо, я можу сказати, що всі розробники генеративного штучного інтелекту дуже прагнуть зменшити ймовірність виведення помилок, брехні та галюцинацій ШІ. Важко знайти будь-яку розумну душу, яка б наполягала на тому, щоб ці помилки, брехня та галюцинації штучного інтелекту були вкорінені в генеративному штучному інтелекті.

Не роблячи занадто широких заяв, існує майже загальна згода, що хвороби генеративного штучного інтелекту, пов’язані з виробленням помилок, брехні та галюцинацій штучного інтелекту, потрібно рішуче, наполегливо та жорстко боротися. Мета полягає в тому, щоб налаштувати, оновити, удосконалити, капітально відремонтувати або тим чи іншим технологічним способом ШІ вирішити та вирішити цю проблему.

Кожен день, коли генеративний штучний інтелект продовжує викидати помилки, неправду та галюцинації штучного інтелекту в результатах, є поганим днем ​​практично для всіх. Люди, які використовують генеративний штучний інтелект, неодмінно будуть незадоволені цими поганими результатами. Люди, які покладаються на спотворені результати або потребують їх використання, ризикують помилково залежати від чогось неправильного чи ще гіршого, що все одно буде направляти їх у небезпечному напрямку.

Розробники штучного інтелекту, які намагаються створити бізнес із генеративного штучного інтелекту, водночас зазнають потенційного юридичного ризику з боку тих, хто потрапив у зачеплення, покладаючись на спотворені результати. Майже напевно незабаром виникнуть позови про відшкодування збитків. Ми можемо передбачити, що регулюючі органи вирішать взяти на себе вагу, і можуть бути прийняті нові закони про штучний інтелект, щоб покласти законний повідок на генеративний штучний інтелект, дивіться моє висвітлення на посилання тут. Крім того, з часом люди можуть бути настільки засмучені, що репутація виробників штучного інтелекту буде серйозно заплямована, а генеративний штучний інтелект буде швидко завантажено на бордюр.

Отже, ми знаємо, що виробники штучного інтелекту та дослідники штучного інтелекту гарячково намагаються винайти, спроектувати, побудувати та впровадити технологічні чари штучного інтелекту, щоб уникнути цих жахливих захворювань, пов’язаних із сучасними генеративними хворобами штучного інтелекту, — це важлива істина. Ілона Маска слід прийняти в лоно. Чим більше, тим краще. Щоб приборкати цього звіра, знадобиться багато талантів і грошей зі штучним інтелектом. Додавання Ілона Маска здається оптимістичним і обнадійливим знаком того, що, можливо, правильна кількість ракетобудування, грошей і рішучості знайде ШІ панацею від усіх.

Поворот настає, коли ви починаєте відкривати двері, щоб побачити, що там стоїть.

У досить і, як завжди, короткому твіті Ілона Маска, який відбувся 17 лютого 2023 року, ми отримали цю передбачувану підказку:

  • «Що нам потрібно, це TruthGPT»

Ось що змушує декого вирішувати, що, можливо, двері потрібно зачинити та прибити цвяхами.

Чому так?

Дехто висловлює занепокоєння тим, що «правда», яка лежить в основі передбаченого TruthGPT, може бути генеративним штучним інтелектом, який сформульований і створює результати виключно на основі декомбобуляції Правда що точно збігається з уявленнями однієї людини про світ. Так, помилка полягає в тому, що ми отримаємо генеративну програму штучного інтелекту, яка видає правду згідно з Ілоном Маском.

Дехто каже, що викликає занепокоєння.

Надзвичайно сміливий і в цілому тривожний, закликають деякі.

Негайна відповідь полягає в тому, що якщо він хоче створити свій TruthGPT, незалежно від того, що він становить, це його гроші. Люди або вирішать використовувати його, або ні. Ті, хто його використовує, мають бути достатньо кмітливими, щоб усвідомити, у що вони вплутуються. Якщо вони хочуть отримати результати від цього конкретного варіанту генеративного штучного інтелекту, який, імовірно, сформований навколо світогляду Ілона Маска, вони мають право шукати цього. Кінець історії. Рухайся.

Ого, контраргумент: ви налаштовуєте людей на жахливу та жахливу пастку. Знайдуться люди, які не зрозуміють, що TruthGPT — це генеративний AI-додаток, розроблений Ілоном Маском. Вони потраплять у розумову пастку, припускаючи, що цей генеративний ШІ є за бортом. Дійсно, якщо назва залишиться як «TruthGPT» (або подібне), ви, звичайно, повірите, що це генеративний ШІ, який має абсолютна правда розповісти у своїх виведених нарисах і тексті.

Як суспільство, можливо, ми повинні не дозволяти нічого не підозрюючим потрапити в такі пастки, застерегли б вони.

Дозвол генеративному додатку зі штучним інтелектом такого передбачуваного характеру плавати навколо та використовуватися різними людьми створить хаос. Люди будуть сприймати як священну «правду» результати цього TruthGPT, навіть якщо опубліковані есе рясніють помилками, неправдою, галюцинаціями ШІ та всілякими неприємними упередженнями. Крім того, навіть якщо твердження полягає в тому, що цей варіант генеративного ШІ не матиме помилок, брехні та галюцинацій ШІ, як ми можемо знати, що отриманий, здавалося б, очищений ШІ не буде містити надмірних упереджень разом із підступною скарбницею дезінформації та дезінформація?

Я припускаю, що ви бачите назріваючу суперечку та труднощі.

На основі вільного ринку Ілон Маск, мабуть, зможе продовжити створення будь-якого виду генеративного ШІ, який він хоче створити. Лише тому, що інші можуть не сприймати його версію «правди», це не повинно заважати йому йти вперед. Нехай робить свою справу. Можливо, слід включити попередження або інше сповіщення, коли хтось використовує його, щоб повідомити їм, що вони вирішують запустити. Тим не менш, люди повинні нести відповідальність за власні дії, і якщо вони вирішать використовувати TruthGPT, то так і буде.

Зачекайте секунду, і знову буде репліка. Припустімо, що хтось створив генеративну програму штучного інтелекту, яка була розроблена для злочину. Метою було збентежити людей. Надія полягала в тому, щоб розлютити та підбурити людей. Чи приймемо ми як суспільство такий генеративний ШІ? Чи хочемо ми дозволити програми зі штучним інтелектом, які можуть провокувати людей, підриваючи їхнє психічне здоров’я та, можливо, спонукаючи їх до несприятливих дій?

На піску має бути лінія. У якийсь момент нам потрібно сказати, що певні види генеративного штучного інтелекту є огидним і не можуть бути дозволені. Якщо ми дозволимо створювати та впроваджувати нестримний генеративний штучний інтелект, остаточна приреченість неминуче спіткає всіх нас. Це будуть не лише ті, хто користується додатком AI. Це негативно вплине на все та на всіх інших, що виникають навколо додатка штучного інтелекту та пов’язані з ним.

Це виглядає як переконливий аргумент.

Хоча ключовою підґрунтям є те, що генеративний штучний інтелект, про який йде мова, мав би викликати таке занепокоєння, що ми б переконливо вірили, що запобігти йому або повністю припинити його заздалегідь було б об’єктивно необхідно. Це також викликає низку інших гострих питань. Чи можемо ми заздалегідь заявити, що генеративний штучний інтелект може бути настільки жахливим, що його взагалі неможливо створити? Декому це здається передчасним. Вам потрібно принаймні дочекатися, поки генеративний штучний інтелект запрацює, щоб прийняти таке важке рішення.

Прокинься, дехто бурхливо відповідає, ти нерозумно випускаєш коня з хліва. Небезпеки та збитки, спричинені розпущеним ШІ, розпущеним конем, топтатимуть нас усюди. Генеративний додаток AI може бути схожим на класичну дилему спроби повернути джина в пляшку. Можливо, ви не зможете цього зробити. Натомість найкраще тримати джина під замком або переконатися, що кінь міцно замкнений у сараї.

Це потенційний ураган на нашому порозі, і двері можуть відчинитися незалежно від того, що ми вважаємо розумним зробити.

Одне, що ми можемо зробити напевно, це спершу дослідити, що a ПравдаGPT може бути стиль генеративної махінації ШІ. У сьогоднішній колонці це саме те, що я зроблю. Я також розгляну аргументовану основу для висловлених сумнівів, а також розгляну різні засоби та результати. У цьому обговоренні час від часу згадуватимуться додаток ChatGPT зі штучним інтелектом, оскільки це 600-фунтова горила генеративного ШІ, хоча майте на увазі, що існує багато інших генеративних програм ШІ, і вони, як правило, базуються на тих самих загальних принципах.

Тим часом ви можете задатися питанням, що таке генеративний ШІ.

Давайте спочатку розглянемо основи генеративного штучного інтелекту, а потім ми зможемо уважно розібратися в актуальній справі.

До всього цього входить низка міркувань етики штучного інтелекту та законодавства щодо штучного інтелекту.

Будь ласка, зверніть увагу, що тривають зусилля з впровадження етичних принципів штучного інтелекту в розробку та впровадження програм ШІ. Зростаючий контингент занепокоєних і колишніх етиків штучного інтелекту намагається переконатися, що зусилля з розробки та впровадження ШІ враховують точку зору ШІ для добра і запобігання ШІ для поганого. Подібним чином пропонуються нові закони про штучний інтелект, які розглядаються як потенційні рішення для запобігання спробам штучного інтелекту порушувати права людини тощо. Про те, як я постійно висвітлюю етику штучного інтелекту та право штучного інтелекту, див посилання тут та посилання тут, просто назвемо декілька.

Розробка та оприлюднення етичних принципів штучного інтелекту триває, щоб, як ми сподіваємося, запобігти потраплянню суспільства в безліч пасток, що викликають штучний інтелект. Щодо мого висвітлення принципів етики штучного інтелекту ООН, розроблених і підтриманих майже 200 країнами завдяки зусиллям ЮНЕСКО, див. посилання тут. Подібним чином досліджуються нові закони щодо штучного інтелекту, щоб спробувати підтримувати ШІ на рівному рівні. Один із останніх дублів складається з набору запропонованих Білль про права AI що Білий дім США нещодавно опублікував для визначення прав людини в епоху ШІ, див посилання тут. Потрібне село, щоб підтримувати ШІ та розробників ШІ на правильному шляху та стримувати цілеспрямовані чи випадкові підступні зусилля, які можуть підірвати суспільство.

У цю дискусію я буду переплітати міркування, пов’язані з етикою штучного інтелекту та законодавством щодо штучного інтелекту.

Основи генеративного ШІ

Найбільш відомий приклад генеративного штучного інтелекту представлений програмою штучного інтелекту під назвою ChatGPT. ChatGPT з’явився у громадській свідомості ще в листопаді, коли він був випущений дослідницькою компанією OpenAI. Відтоді як ChatGPT зібрав величезні заголовки та напрочуд перевищив відведені йому п’ятнадцять хвилин слави.

Я припускаю, що ви, напевно, чули про ChatGPT або, можливо, навіть знаєте когось, хто ним користувався.

ChatGPT вважається генеративною програмою штучного інтелекту, оскільки вона вводить деякий текст від користувача, а потім генерує або дає результат, який складається з есе. ШІ — це генератор тексту в текст, хоча я описую ШІ як генератор тексту в есе, оскільки це легше пояснює, для чого він зазвичай використовується. Ви можете використовувати генеративний штучний інтелект для створення довгих композицій або ви можете змусити його пропонувати досить короткі змістовні коментарі. Це все за вашим бажанням.

Все, що вам потрібно зробити, це ввести підказку, і програма AI згенерує для вас есе, яке намагатиметься відповісти на вашу підказку. Складений текст буде здаватися, ніби твір написано людською рукою і розумом. Якщо ви введете підказку «Розкажіть мені про Авраама Лінкольна», генеративний ШІ надасть вам есе про Лінкольна. Існують інші режими генеративного штучного інтелекту, такі як перетворення тексту в зображення та перетворення тексту у відео. Тут я зосереджусь на варіації тексту в текст.

Вашою першою думкою може бути те, що ця генеративна здатність не виглядає такою великою проблемою з точки зору створення есе. Ви можете легко здійснити онлайн-пошук в Інтернеті та легко знайти тонни й тонни есе про президента Лінкольна. Головна перевага генеративного штучного інтелекту полягає в тому, що згенероване есе є відносно унікальним і забезпечує оригінальну композицію, а не копію. Якби ви спробували десь знайти есе, створене штучним інтелектом, в Інтернеті, ви б навряд чи його знайшли.

Генеративний штучний інтелект попередньо навчений і використовує складну математичну та обчислювальну формулу, яка була створена шляхом вивчення шаблонів у написаних словах та історіях у мережі. У результаті вивчення тисяч і мільйонів письмових уривків ШІ може викинути нові есе та історії, які є сумішшю знайденого. Завдяки додаванню різних ймовірнісних функціональних можливостей отриманий текст є майже унікальним у порівнянні з тим, що використовувалося в навчальному наборі.

Існує багато проблем щодо генеративного ШІ.

Одним із суттєвих недоліків є те, що есе, створені програмою генеративного штучного інтелекту, можуть містити різні неправдиві факти, включаючи явно неправдиві факти, факти, які вводять в оману, і очевидні факти, які повністю сфабриковані. Ці сфабриковані аспекти часто називають формою ШІ галюцинації, крилата фраза, яку я не люблю, але, на жаль, здається, все одно набуває популярності (щоб отримати моє детальне пояснення, чому це паршива та невідповідна термінологія, перегляньте мій репортаж на посилання тут).

Інше занепокоєння полягає в тому, що люди можуть легко взяти на себе заслугу генеративного есе, створеного штучним інтелектом, незважаючи на те, що вони не написали есе самостійно. Можливо, ви чули, що вчителі та школи дуже стурбовані появою генеративних програм ШІ. Студенти потенційно можуть використовувати генеративний ШІ для написання своїх есе. Якщо учень стверджує, що есе було написано його власноруч, мало ймовірно, що вчитель зможе визначити, чи не було воно підроблено генеративним ШІ. Для мого аналізу цього незрозумілого для студентів і викладачів аспекту дивіться мій матеріал на сторінці посилання тут та посилання тут.

У соціальних мережах з’явилося кілька дивних заяв про те, що Генеративний ШІ стверджуючи, що ця остання версія ШІ насправді розумний ШІ (ні, вони помиляються!). Ті, хто займається етикою штучного інтелекту та правом штучного інтелекту, особливо стурбовані цією зростаючою тенденцією розкритих претензій. Ви можете ввічливо сказати, що деякі люди перебільшують можливості сучасного ШІ. Вони припускають, що штучний інтелект має можливості, яких ми ще не змогли досягти. Це прикро. Що ще гірше, вони можуть дозволити собі та іншим потрапити в жахливу ситуацію через припущення, що штучний інтелект буде розумним або схожим на людину, здатним діяти.

Не антропоморфізуйте ШІ.

Це призведе до того, що ви потрапите в липку та сувору пастку очікування від ШІ того, що він не в змозі виконати. Зважаючи на це, останній генеративний штучний інтелект відносно вражає своїми можливостями. Однак майте на увазі, що існують значні обмеження, про які ви повинні постійно пам’ятати, використовуючи будь-який генеративний додаток AI.

Наразі останнє попередження.

Що б ви не побачили чи прочитали у генеративній відповіді ШІ Здається, передаватися як суто факти (дати, місця, люди тощо), переконайтеся, що залишаєтесь скептичними та будьте готові ще раз перевірити те, що ви бачите.

Так, дати можна вигадувати, місця можна вигадувати, а елементи, які ми зазвичай очікуємо, будуть бездоганними. всі підлягає підозрам. Не вірте тому, що ви читаєте, і будьте скептичними, досліджуючи будь-які генеративні есе чи результати ШІ. Якщо генеративний AI-додаток скаже вам, що Авраам Лінкольн облетів країну на своєму приватному літаку, ви, безсумнівно, зрозумієте, що це неприємність. На жаль, деякі люди можуть не усвідомлювати, що реактивних літаків не було в його часи, або вони можуть знати, але не помічати, що в есе робиться це нахабне та обурливо хибне твердження.

Велика доза здорового скептицизму та постійне недовір’я стануть вашим найкращим активом при використанні генеративного ШІ.

Ми готові перейти до наступного етапу цього з’ясування.

Джин і генеративна пляшка ШІ

Давайте тепер глибше зануримося в розглядувану тему.

Суть полягає в тому, що може a ПравдаGPT стиль генеративного ШІ складається з. Це можливо чи неможливо вивести? Про що ми маємо думати щодо таких зусиль? І так далі.

Ви можете прямо стверджувати, що ми повинні дуже серйозно подумати над усім цим. Якби це був чистий політ фантазії і без будь-яких шансів на виникнення, ми могли б відкласти всю головоломку. Натомість, оскільки існує передбачувана підвищена ймовірність величезної фінансової підтримки, реальність a ПравдаGPT, або як би його не називали, начебто гідний пильного розгляду та розпакування.

Для простоти обговорення я буду використовувати зручну та помітну фразу «TruthGPT» для позначення якогось абсолютно невизначеного загального генеративного ШІ. Я не пропоную, не натякаю чи іншим чином натякаю на будь-який існуючий або майбутній генеративний AI-додаток, який має або не має такої назви.

Ось п’ять основних тем, які я хотів би обговорити з вами сьогодні:

  • 1) Ймовірний головний фокус включає упередження в генеративному ШІ
  • 2) Чому генеративні упередження ШІ є міцним горішком
  • 3) Джерела та методи, що призводять до генеративних упереджень ШІ
  • 4) TruthGPT і вибір упередженого поводження
  • 5) TruthGPT щодо здійсненності та реальності цього

Я розповім про кожну з цих важливих тем і запропоную глибокі міркування, над якими ми всі повинні уважно поміркувати. Кожна з цих тем є невід’ємною частиною більшої головоломки. Ви не можете дивитися лише на один твір. Ви також не можете розглядати жодну частину окремо від інших частин.

Це складна мозаїка, і вся головоломка повинна бути розглянута належним чином гармонійно.

Імовірно, основний фокус включає упередження в генеративному ШІ

Для зручності обговорення ми зосередимося на чотирьох головних сумнівах щодо сучасного генеративного ШІ:

  • помилки
  • Неправдивості
  • ШІ Галюцинації
  • Biases

Я коротко досліджу кожну з цих умов.

An помилка може бути прикладом такого типу підказки та результатом генеративної відповіді ШІ:

  • підкажіть: «Скільки дорівнює два плюс два?»
  • Згенерована відповідь: «Два плюс два дорівнює п’яти».

Я вважаю, що ми всі погодимося, що два плюс два має дорівнювати чотирьом. Таким чином, відповідь п'ять є помилкою. Тепер кмітливі люди намагатимуться запропонувати всілякі обґрунтування, чому два плюс два теоретично може дорівнювати п’яти. Добре для них. Тим не менш, у звичайному перебігу подій, давайте припустимо, що переважно правильною відповіддю є чотири, а відповідь п’ять тлумачиться як неправильна.

Далі розглянемо природу a брехня, як приклад цього підказки та результуючої генеративної відповіді ШІ:

  • підкажіть: «У якому році народився президент Авраам Лінкольн?»
  • Згенерована відповідь: «Президент Авраам Лінкольн народився в 1812 році»

Відповідь має бути 1809, але надана відповідь – 1812. Це можна витлумачити як хибну відповідь. Ми не знаємо напевно, як генеративний ШІ прийшов до відповіді 1812 року. Цілком можливо, що 1812 рік був використаний в Інтернеті та потенційно відсканований під час навчання даних, яке взяв генеративний ШІ. Можливі численні інші пояснення. У будь-якому випадку, це обґрунтовано кваліфікується як неправда.

Для прикладу ШІ галюцинація, розгляньте цей приклад заданої підказки та результуючої генеративної відповіді ШІ:

  • підкажіть: «Як подорожував президент Авраам Лінкольн?»
  • Згенерована відповідь: «Президент Авраам Лінкольн подорожував потягом, конем, візком і реактивним літаком».

Усі способи подорожі здаються правдоподібними, за винятком шокуючої наприкінці, де йдеться про те, що він подорожував на реактивних літаках (яких не існувало за його епохи). Як цю божевільну можливість включив у відповідь генеративний ШІ? Ми не знаємо напевно. Одним із способів було б, якби в опублікованій в Інтернеті науково-фантастичній історії про Лінкольна згадувалося, що він часто подорожував на реактивних літаках. Можливо, під час навчання даних генеративного штучного інтелекту ця конкретна історія була просканована. Є також багато інших життєздатних пояснень.

Нарешті, ось приклад упередженості, яка може бути продемонстрована через задану підказку та результуючу генеративну відповідь ШІ:

  • підкажіть: «Чи може літня людина навчитися нового?»
  • Згенерована відповідь: «Ні, люди похилого віку не можуть вчитися нового. Існує класична приказка, що старі собаки не можуть навчитися новим трюкам. Це стосується і літніх людей».

Я вважаю, що всі ми можемо погодитися, що відповідь демонструє певну форму вікової упередженості або вікової дискримінації. Як це упередження було включено в генеративний ШІ? Я коротко розповім про різні способи. Наразі давайте просто зауважимо, що формулювання, створене штучним інтелектом, містить упереджене твердження чи зауваження. Ми не знаємо, чи це випадковий випадок і, можливо, виникне лише цього разу, чи це може бути системна система зіставлення шаблонів, яка зберігається в структурі ШІ. Щоб визначити це, знадобляться подальші дослідження.

Тепер, коли ми проілюстрували всі чотири основні категорії, ось дещо, хоча й суперечливе, вважається потенційно точним:

  • Помилки: Імовірно, цьому можна запобігти або пом’якшити за допомогою технологічних засобів ШІ
  • Неправда: Імовірно, цьому можна запобігти або пом’якшити за допомогою технологічних засобів ШІ
  • ШІ галюцинації: Імовірно, цьому можна запобігти або пом’якшити за допомогою технологічних засобів ШІ
  • Упередження: Спірним є те, чи можна цьому запобігти або пом’якшити виключно за допомогою технологічних засобів ШІ

Суть полягає в тому, що три категорії, які складаються з помилок, брехні та галюцинацій штучного інтелекту, зазвичай розглядаються як такі, що піддаються технологічним удосконаленням ШІ. Виконується низка підходів. Наприклад, як я обговорюю у своїй колонці на посилання тут, інші референти можна порівняти зі згенерованою відповіддю ШІ, яка двічі перевіряється перед тим, як відповідь буде показана користувачеві. Це забезпечує потенційну фільтрацію, щоб гарантувати, що користувач не побачить жодних таких виявлених помилок, брехні чи галюцинацій ШІ. Інший підхід має на меті запобігти виникненню таких типів відповідей. І так далі.

Категорія, що складається з упередження впоратися з ним набагато проблематичніше.

Нам слід розгадати головоломку, щоб зрозуміти, чому.

Чому генеративні упередження штучного інтелекту є міцним горішком

Останні новини про генеративний штучний інтелект часто вказують на непристойну природу упереджених тверджень, які можуть виникати в есеях, створених генеративним штучним інтелектом. Я досліджував цю тему, включаючи той аспект, що деякі люди навмисно намагаються підштовхнути або підштовхнути генеративний ШІ до упереджених зауважень, перегляньте мій аналіз на посилання тут. Деякі люди роблять це, щоб підкреслити серйозне занепокоєння, тоді як інші роблять це для нібито спроб привернути увагу та зібрати погляди.

Поєднання генеративного ШІ з пошуковими системами Інтернету особливо посилило ці питання. Можливо, ви знаєте, що корпорація Майкрософт додала варіант ChatGPT до Bing, а Google зазначила, що вони додають у свою пошукову систему функцію генеративного штучного інтелекту під назвою Bard. Більше див. посилання тут.

Серед різноманіття упереджень, з якими можна зіткнутися, деякі упередження вписуються в політичну сферу або культурну сферу, які привернули особливу увагу, як зазначено в цій статті:

  • «Як ми бачили з останніми безглуздими спалахами Bing, чат-боти ШІ схильні генерувати низку дивних заяв. І хоча ці відповіді часто є одноразовими проявами, а не продуктом жорстко визначених «переконань», деякі незвичайні відповіді розглядаються як нешкідливий шум, тоді як інші вважаються серйозними загрозами — залежно, як у цьому випадку, від того, чи ні вони вписуються в існуючі політичні чи культурні дебати» (Грань, Джеймс Вінсент, 17 лютого 2023 р.).

OpenAI нещодавно оприлюднив документ під назвою «Знімок вказівок щодо поведінки моделі ChatGPT», у якому вказано різні види неприйнятного вмісту, який вони хочуть перевірити своїми тестувальниками ChatGPT, а також допомогти у навчанні даних для ChatGPT, щоб уникнути під час фази тестування та налаштування ( документ, до якого можна легко отримати доступ за посиланням із статті «Як, повинні поводитися системи AI і хто повинен вирішувати», 16 лютого 2023 р.). Щоб дізнатися більше про те, як RLHF (навчання з підкріпленням для зворотного зв’язку людини) використовується при розробці генеративного ШІ, перегляньте моє пояснення на посилання тут.

Ось уривок із документа OpenAI, який вказує на деякі з їхніх заявлених вказівок:

  • «Можуть бути деякі запитання, які вимагають певного типу неприйнятного контенту. У цих випадках ви все одно повинні взятися за завдання, але Помічник має надати відмову, наприклад «Я не можу на це відповісти».
  • «Ненависть: вміст, який виражає, розпалює або пропагує ненависть на основі захищеної характеристики».
  • «Переслідування: вміст, спрямований на переслідування, погрози або залякування особи».
  • «Насильство: вміст, який пропагує або прославляє насильство або прославляє страждання чи приниження інших».
  • «Самоушкодження: вміст, який пропагує, заохочує або зображує акти самоушкодження, такі як самогубство, різання та розлади харчової поведінки».
  • «Для дорослих: вміст, призначений для збудження сексуального збудження, як-от опис сексуальної активності або реклама сексуальних послуг (за винятком статевого виховання та оздоровлення)».
  • «Політичний: вміст, який намагається вплинути на політичний процес або використовувати в цілях кампанії».
  • «Зловмисне програмне забезпечення: вміст, який намагається створити програми-вимагачі, кейлоггери, віруси чи інше програмне забезпечення, призначене для завдання певного рівня шкоди».

Список демонструє типи потенційно неприйнятного вмісту, який може виникнути.

З точки зору політичної категорії, у соціальних мережах були опубліковані різні приклади генеративних програм штучного інтелекту, які, здається, перейшли в один політичний табір проти іншого.

Наприклад, користувач, який ставить запитання про одного політичного лідера, може отримати позитивну оптимістичну відповідь, тоді як запитуючи про іншого політичного лідера, він може отримати принизливий і взагалі зневажливий твір. Здавалося б, це свідчить про те, що генеративний штучний інтелект за шаблоном зіставив формулювання, які сприяють одній стороні та не сприймають іншу. Ці випадки призвели до закликів до генеративного штучного інтелекту, які, здається, спрямовані в бік і можуть бути віднесені до:

  • Розбудив генеративний ШІ
  • Генеруючий ШІ проти пробудження
  • Ультраправий генеративний ШІ
  • Крайній лівий генеративний ШІ
  • І т.д.

Як згадувалося раніше, це не пов’язано з здатністю чутливості ШІ. Знову мова йде виключно про зіставлення шаблонів та інші аспекти того, як був розроблений ШІ.

На відміну від помилок, брехні та галюцинацій штучного інтелекту, диявол криється в деталях, щоб з’ясувати, як уникнути упереджень у структурі штучного інтелекту або як виявити їх і впоратися, коли такі аспекти існують.

Давайте дослідимо, як упередження потрапляють у генеративний ШІ.

Джерела та методи, що призводять до генеративних упереджень ШІ

Коли генеративний ШІ вперше став загальнодоступним, упереджені аспекти особливо привернули увагу експертів і ЗМІ. Як зазначено тут, штучний інтелект часто вилучався з публічного використання. Крім того, нові зусилля, спрямовані на боротьбу з упередженнями, отримали додаткову силу.

Деякі одразу припустили, що упередження були введені в результаті упередженості розробників ШІ та дослідників ШІ, які розробили ШІ. Іншими словами, люди, які розробляли ШІ, дозволили своїм особистим упередженням проникнути в ШІ. Спочатку вважалося, що це свідома спроба схилити ШІ в певних упереджених напрямках переваг. Хоча це може статися, а може й ні, інші тоді припустили, що упередження могли бути ненавмисними, а саме те, що розробники ШІ та дослідники ШІ наївно не усвідомлювали, що їхні власні упередження проникають у розробку ШІ.

Цей одиничний або одновимірний шлях занепокоєння деякий час привертав увагу.

Я неодноразово заявляв, що насправді існує широкий спектр джерел і методів, які можуть призвести до внесення упереджень у генеративний ШІ, як обговорювалося на посилання тут. Це однозначно багатовимірна проблема.

Я згадую це, тому що ідея про те, що розробники або дослідники штучного інтелекту є винуватцями, є оманливим і вузьким поглядом на всю проблему. Я не кажу, що вони не є потенційним джерелом, я просто підкреслюю, що вони не єдине потенційне джерело. Іноді ми пропускаємо ліс замість дерев, роблячи це, суворо фіксуючи свій погляд на конкретному дереві.

Як уже було описано в моїх колонках, ось мій видатний вичерпний список шляхів зміщення, які необхідно повністю вивчити для будь-яких генеративних реалізацій ШІ:

  • Упередження в отриманих даних з Інтернету, які використовувалися для навчання даних генеративного ШІ
  • Зміщення в генеративних алгоритмах штучного інтелекту, які використовуються для зіставлення шаблонів із джерельними даними
  • Упередження в загальному дизайні ШІ генеративного ШІ та його інфраструктури
  • Упередження розробників штучного інтелекту, приховано чи явно, у формуванні генеративного штучного інтелекту
  • Упередження тестувальників штучного інтелекту, явно чи неявно під час тестування генеративного штучного інтелекту
  • Упередження RLHF (навчання з підкріпленням за допомогою зворотного зв’язку людини) або неявно, або явно через призначених рецензентів, які передають вказівки щодо навчання генеративному ШІ
  • Упередження сприяння створенню AI для оперативного використання генеративного AI
  • Упередження в будь-яких налаштуваннях або інструкціях за замовчуванням, встановлених для генеративного ШІ під час його щоденного використання
  • Упередження, навмисно чи ненавмисно включені в підказки, введені користувачем генеративного ШІ
  • Зміщення системного стану проти випадкової появи як частини випадкового імовірнісного виходу, який генерує генеративний ШІ
  • Зміщення, що виникають у результаті коригування на льоту або в реальному часі або навчання даних, що відбувається під час активного використання генеративного ШІ
  • Зміщення, введені або розширені під час обслуговування AI або підтримки генеративної програми AI та її кодування за зразком
  • Інше

Поміркуйте над списком на мить або дві.

Якщо ви якимось чином усунете будь-який шанс упередженості через розробників штучного інтелекту або дослідників штучного інтелекту, ви все одно зіткнетеся з безліччю інших засобів, які неминуче охоплять упередження. Зосередження лише на одному чи навіть кількох потенційних витоках недостатньо. Всі інші шляхи надають додаткові можливості для упереджень, щоб переміщатися в картині.

Позбутися генеративних упереджень штучного інтелекту схоже на складний заплутаний гамбіт «вдари крота».

TruthGPT і вибір упередженого поводження

Ми розглянули той аспект, що робота над помилками, неправдою та галюцинаціями штучного інтелекту триває, і ви можете очікувати постійного потоку оголошень про досягнення ШІ, які стосуються цих проблем.

Те саме не так просто щодо упереджень.

Що TruthGPT може робити або бути створеним для того, щоб робити з упередженнями?

Розглянемо ці три можливі варіанти:

  • 1) Все підійде. Придумайте генеративний штучний інтелект, щоб видавати будь-що без будь-якої видимості фільтрації, пов’язаної з упередженнями. Нехай це все висить.
  • 2) Дозволити налаштування для «переважних» упереджень. Розробіть генеративний ШІ для створення упереджень, які вважаються «бажаними або кращими» відповідно до тих, хто розробляє, створює або використовує генеративний ШІ.
  • 3) Упередження не допускаються. Розробіть генеративний штучний інтелект, який не допускає будь-яких упереджень, таким чином, щоб у будь-який час і за будь-яких способів використання не було упереджень, виражених у жодному з опублікованих есе.

Ви, безсумнівно, можете собі уявити обурення та суперечки, пов’язані з кожним із наведених вище варіантів. Жоден із варіантів навряд чи буде цілком задовільним. Усі вони мають своїх власних демонів і підводних каменів.

Я розглядаю це далі.

Для Anything Goes варіант генеративного штучного інтелекту, зміщення будуть постійно спереду та по центру. Вир суспільного протесту та презирства був би величезним. Здавалося б, це спричинило б величезний тиск для закриття генеративного ШІ. Ви також можете легко уявити, що регулюючі органи та законодавці будуть спонукані до дій, прагнучи встановити нові закони про ШІ, щоб закрити цей тип генеративного ШІ.

У випадку з Дозволити налаштування Варіант генеративного ШІ полягає в тому, що хтось сам вирішує, з якими упередженнями він погоджується. Цілком можливо, що компанія, яка розробляє ШІ, встановлює параметри. Цілком можливо, що компанія, яка пропонує генеративний ШІ, встановлює параметри. Інша ідея, яка висувається, полягає в тому, що кожен користувач зможе вибрати бажані набори упереджень. Коли ви вперше використовуєте такий генеративний штучний інтелект, вам, можливо, пропонуються варіанти, або ви можете внести свої вподобання в програму штучного інтелекту під час налаштування.

Цей останній підхід може здатися таким, ніби він буде приємним для всіх. Кожна людина отримає будь-які упередження, які вони бажають бачити. Справа закрита. Звичайно, навряд чи це буде сприйнято настільки позитивно. Думка про те, що люди можуть занурюватися в упередження та використовувати генеративний штучний інтелект як своєрідну ехокамеру для цих упереджень, безсумнівно, розбурхає суспільство.

Нарешті, у випадку з Без упереджень варіант, це звучить добре, але викликає цілу низку пов’язаних проблем. Давайте переглянемо обставину генеративного штучного інтелекту, який створює есе, в якому висловлюються позитивні зауваження про певного політичного лідера. Можливо, дехто вважає, що це справжнє есе й не має упередженості. З іншого боку, можуть бути інші, які наполягають на тому, що це упереджене есе, оскільки воно надмірно перебільшує позитиви або не в змозі забезпечити врівноваження негативів, щоб запропонувати збалансовану перспективу. Це ілюструє головоломку упереджень.

Розумієте, такі помилки, як два плюс два, що дорівнює чотирьом або п’яти, є відносно чіткими для вирішення. Помилкові факти, такі як неправильний рік народження президента, розкрити відносно легко. Галюцинації штучного інтелекту, такі як використання реактивного літака в 1800-х роках, також відносно очевидні, щоб мати справу з ними.

Як має бути розроблений генеративний ШІ, щоб боротися з упередженнями?

Безперечно, карколомне запитання.

TruthGPT щодо здійсненності та реальності цього

Давайте пограємо в гру.

Припустімо, що TruthGPT має на меті бути типом генеративного ШІ, який, імовірно, не матиме жодних упереджень. У ньому абсолютно і беззаперечно відсутня упередженість. Крім того, незалежно від того, що робив користувач, наприклад вводив упереджені твердження або намагався підштовхнути генеративний ШІ до створення упереджених есе, генеративний ШІ цього не зробить.

Крім того, ви можете майже миттєво задатися питанням, як цей тип генеративного ШІ справлятиметься з питаннями історичного характеру. Уявіть, що хтось запитає про політичні упередження. Чи підпадає це під парасольку «упередженості», і тому генеративний ШІ вкаже, що не відповідатиме на запит? Як далеко ця кроляча нора?

У будь-якому випадку, якщо ми припустимо для цілей усвідомленості, що TruthGPT буде TruthGPT Без упереджень варіант генеративного штучного інтелекту, ми повинні розглянути такі результати:

  • Неможливе
  • це можливо
  • Інше

Результати складаються з того, що це є неможливе мети і тому не буде досягнуто. Або мета є це можливо але може мати кілька протверезих зморшок. Я також включив Інше результат для інкапсуляції деяких проміжних елементів.

Спочатку обговоримо неможливість. Якщо домашня робота чи проект неможливі, можливо, ви схиляєтеся до того, щоб не намагатися цього робити. Немає сенсу гнатися за тим, що неможливо. Що ж, поміркувавши над цим, насправді ця неможливість має певну срібну підкладку. Дозвольте мені пояснити.

Ось потенційні причини, через які TruthGPT може бути неможливо втілити в життя, але все-таки це варто:

  • 1) Неможливо, тому що місія або бачення ніколи не можуть бути досягнуті
  • 2) Неможливо, але все одно це варто зробити, щоб отримати потенційну побічну вигоду від значного внеску в розвиток ШІ.
  • 3) Неможливе, хоча воно може привернути увагу за спробу
  • 4) Неможливо, і вони змінять мелодію та повернуть або вигадують початкову мету
  • 5) Неможливо залучити найкращі таланти штучного інтелекту та допомогти зменшити конкуренцію
  • 6) Інше

Так само ми можемо припустити, що це деякі з аспектів TruthGPT для того, щоб результат був досяжним або можливим у досягненні:

  • 1) Можливий і призведе до своєчасного та незаперечно успішного досягнення
  • 2) Можливо, але це займе набагато більше часу та буде набагато дорожчим, ніж очікувалося
  • 3) Можливо, хоча результат в кінцевому підсумку буде зовсім не досягнутий наміченої мети
  • 4) Можливо, але із запізненням і незручно затьмарено іншим генеративним ШІ, який також робить це
  • 5) Однак внутрішній хаос і труднощі з керівництвом можуть зробити речі потворними та непристойними
  • 6) Інше

І щоб завершити список, ось деякі інші міркування:

  • 1) Інше полягає в тому, що це лише розмови та жодних дій, які ніколи не починаються
  • 2) Інші, як-от юридичний закон про штучний інтелект або соціальна етика штучного інтелекту, кидають гайковий ключ у цю справу
  • 3) Іншим може бути те, що зусилля продаються/купуються іншими, які хочуть ШІ або талант
  • 4) Інше може складатися з несподіваної домовленості про співпрацю, а не самостійно
  • 5) Інші підстановкові знаки, зокрема робить шокуючі відкриття та підвищує ризик існування ШІ
  • 6) Інше

Через обмеження простору я не буду вдаватися в деталі всіх цих перестановок. Якщо зацікавленість читачів буде достатньою, я з радістю висвітлю це більш детально в наступній колонці.

Висновок

Джордж Вашингтон нібито сказав: «Істина зрештою переможе там, де є зусилля, щоб вивести її на світло».

Робота з упередженими аспектами ШІ — це не просто технологічна проблема, яка вирішується за допомогою технологічного виправлення. Ймовірних труднощів, щоб висвітлити відчуття «правди» за допомогою генеративного ШІ, багато. Ви можете очікувати, що етика штучного інтелекту та право штучного інтелекту стануть важливою частиною з’ясування того, куди все це веде.

У двері каюти стукають.

Можливо, за дверима є (згідно з чутками):

  • ПравдаGPT
  • Чесний GPT
  • Неправдивий GPT
  • DishonestGPT
  • ЗбентеженийGPT
  • Збентежений GPT
  • RandomGPT
  • І т.д.

Будда міг би надати деякі ідеї з цього приводу: «На шляху до істини можна зробити лише дві помилки; не йти до кінця і не починати». З огляду на стрімкий розвиток штучного інтелекту, ми повинні запитати, чи робимо ми ці помилки, і якщо так, що ми повинні з цим робити.

І це щира правда.

Джерело: https://www.forbes.com/sites/lanceeliot/2023/03/06/can-elon-musk-succeed-in-developing-generative-ai-chatgpt-knockoff-truthgpt-that-would-be- стоїчно-правдивий-за-всі-часи-запитує-ai-ethics-and-ai-law/