Ніколас Кристакіс: [00:00:05] Добре, отже, людські істоти занурені в соціальні мережі, і ці мережі підкоряються дуже специфічним математичним, біологічним та соціальним принципам. І дедалі більше ми додаємо штучний інтелект у формі онлайн-агентів та фізичних роботів серед нас, які взаємодіють із нами так, ніби вони були соціальними сутностями. І ці типи агентів, яких ми будемо додавати до наших систем, варіюються від безпілотних автомобілів на дорогах до касових апаратів у магазинах, до гуманоїдних роботів у будинках чи на фабриках або на полях битв, чи в ситуаціях гасіння пожеж, до дисембодіованих автономних агентів, таких як онлайн-боти та цифрові помічники штучного інтелекту у наших телефонах або окулярах чи на робочих місцях. І ці технології взаємодіють з нами на рівних умовах, так ніби вони були людьми. І вони приведуть до появи гібридних систем людей і машин. І ці системи пропонують можливості для нового типу соціального штучного інтелекту.
Тепер дозвольте мені навести вам простий приклад. Коли ви отримуєте, наприклад, цифровий асистент, як-от Alexa, виробник цього пристрою дуже стурбований взаємодією між людиною та машиною. І ця взаємодія оптимізована. Наприклад, ви ніколи не купите Alexa, якщо щоразу, коли вам від нього щось потрібно, вам довелося б говорити: "перепрошую, Alexa, мені дуже шкода вас перебивати. Якщо вам не важко, не могли б ви, будь ласка, сказати мені слово? [00:01:35] погода на завтра, правильно?" Це вважалося б абсурдним рівнем ввічливості. Ви очікуєте, що зможете сказати: "Alexa, погода", а потім машина слухняно відповість. І це нормально, поки ви не принесете цю машину додому, і ваші діти не почнуть спілкуватися з нею і вчитимуться бути грубими. А потім вони йдуть на майданчик і стають грубими з іншими дітьми. Отже, ця машина, яка з'явилася серед нас, - це не лише про взаємодію між людиною та машиною, це ще й про взаємодію між людьми в присутності машин. І тому мене цікавить не це, а взаємодії між людьми в присутності машин. І ми можемо використовувати розуміння структури та функцій соціальної мережі, щоб оцінити використання та вплив соціального ШІ на людські групи, з урахуванням таких факторів, як довіра і співпраця, які необхідні для того, щоб групи людей могли працювати разом, і які впливають на поведінку цих колективів.
Отже, дозвольте мені підкреслити частину роботи, яку ми виконуємо, використовуючи кілька підходів до мережевих експериментів, пов'язаних із штучним інтелектом. Ці експерименти оцінюють, як ШІ може вплинути на структуру та функцію людських соціальних взаємодій. [00:02:45] Тепер існує клас проблем колективної дії соціальних взаємодій, які ми маємо, відомий як проблеми координації. Це проблеми, в яких нам потрібно працювати разом, якщо ми хочемо створити щось корисне. Іноді ми вирішуємо ці проблеми, створюючи централізовані установи, такі як поліція, суди чи уряди. Але часто ми можемо вирішити проблеми колективної дії, які вимагають від нас координуватися або співпрацювати з великою кількістю людей у децентралізований спосіб. Ми насправді еволюціонували, щоб мати цю здатність. І одним із специфічних типів проблем колективної дії, з якою я хотів би почати сьогодні, є, по суті, координація.
Отже, наприклад, щоб уникнути цього затору, людям потрібно координуватися, щоб зробити щось відмінне від своїх сусідів. Якщо всі виходять зі своїх будинків в один і той же час, всі застрягнуть у заторі. Але якщо вони порегулюють свої часи виходу і залишать по інтервалах, то ніхто не буде в заторі. Тепер, звичайно, ви можете мати якусь централізовану владу, яка це координує. Ви, хлопці, виходьте першими, потім ви, а потім ви. [00:03:45] Але ідеально було б, щоб ви мали якийсь децентралізований, не ієрархічний спосіб людських істот координуватися, щоб вирішити цю проблему.
Отже, це був наш перший експеримент, який було опубліковано в 2017 році щодо таких гібридних систем, що досліджували, як ШІ може допомогти у такому виклику. Ми вивчали продуктивність людських груп, які брали участь у завданні з координації. Наша парадигма полягала в тому, щоб запозичити з комп'ютерних наук те, що відоме як проблема розфарбовування графу. Це класична проблема в комп'ютерних науках. Але ми зробили так, що взяли це і помістили людей у цю ситуацію. Ми взяли 4,000 людей і розмістили їх у 230 онлайн-групах. Ці люди були поміщені в ці групи. Їх випадковим чином призначали на місце в штучній мережі, яку ми створили, структура якої приблизно нагадувала реальні людські мережі. Їх помістили на ці місця, і їм сказали, що їм призначено один з трьох кольорів, [00:04:46] пурпурний, оранжевий, пурпурний, оранжевий та рожевий. І їм було сказано, що вони повинні вибрати колір, що відрізняється від їх сусідів.
І їм дали п'ять хвилин, щоб це зробити. Отже, ці люди дивитимуться на своїх сусідів. Кожна особа дивитиметься навколо і скажуть, наприклад, цей хлопець тут рожевий. Він бачить, що у нього є рожевий сусід і помаранчевий сусід. Що йому слід зробити, так це перейти до пурпурного кольору. А червоні лінії тут вказують на конфлікти кольору. Іншими словами, якщо два кольори сусідніх вузлів однакові, вони отримують червону лінію. А фонові пурпурні лінії вказують на структуру соціальних взаємодій. Тож ви ставите людей тут. Вони дивляться на своїх сусідів щосекунди або через півтори секунди. Вони роблять переключення, що відповідає меті, що всі мають вибрати колір, який відрізняється від їхніх сусідів, протягом наступних п'яти хвилин. І якщо вони це зроблять, то лише тоді вони отримають оплату. Я збираюсь заплатити вам за спільну роботу. І якщо ви всі працюватимете разом децентралізованим способом, щоб вирішити проблему, ви всі отримаєте оплату. В іншому випадку ви не отримаєте нічого, добре? Отже, ось що відбувається в цьому експерименті. Тут по осі x час у секундах до п'ятихвилинної позначки. [00:05:47] Гра триває п'ять хвилин десь тут. А тут по осі y є цільова функція або кількість конфліктів кольору. І отже, на початку є 12 конфліктів кольору. Їхні початкові кольори призначаються випадковим чином. І це показано тут на цьому маленькому гістограмі. Тож люди починають дивитися навколо і змінювати свої кольори. Ви знаєте, вони перемикаються і перемикаються. І вони досягають цієї точки, коли тепер вони досягли ситуації, в якій існує конфлікт кольору між цими двома людьми. І цей конфлікт, однак, це те, що ми називаємо незворотним конфліктом. Отже, світлосині лінії - це зворотні конфлікти. Це цей хлопець тут. Він може перейти на пурпурний, що вирішує конфлікт. Але ці хлопці тут, що є помаранчевими, немає жодного руху, який вони можуть зробити, щоб зменшити кількість конфліктів кольору у своєму окрузі, правильно? Цей хлопець не може перейти на пурпурний, тому що насправді, якщо він перейде на пурпурний, у нього буде більше конфліктів. У нього, як би це сказати, чотири пурпурних сусіди. А він не може перейти на рожевий, тому що у нього є два рожевих сусіди. Тож він дивиться і каже, що найменше конфліктів у мене - це просто залишитися помаранчевим. Тож тепер ця група застрягла, правильно? [00:06:49] У них незворотний конфлікт, і нічого не може статися. Ніякого прогресу не може бути досягнуто в розв'язанні колективної дійової проблеми, поки один з цих двох людей не зробить контрінтуїтивний рух, не переключиться на кольори пурпурний або рожевий і тимчасово збільшить конфлікти. І це, насправді, те, що відбувається. І тоді час проходить, а люди через 245 секунд вирішують проблему. Машина виявляє рішення, зупиняє гру і платить їм, добре?
Тепер, оскільки ми були хитрими, ми провели деякі експерименти, в яких потайки замінили частину людей на ботів. І ми оцінили, як додавання штучного інтелекту до гібридної системи вплинуло на групову продуктивність. Чи можливо додати декілька ботів до людських груп і покращити їх здатність координуватися у такому виклику? І що ми зробили, це додали трьох ботів і експериментально змінювали два параметри. Де боти були розміщені, де вони випадково потрапляли до мережі, де їх ставили в [00:07:51] центр мережі або де їх ставили на периферію мережі. І ми випадково маніпулювали їхнім AI-потенціалом у дуже тривіальний і простий спосіб. А саме, ми змінювали, чи боти діяли ідеально, чи діяли з певним з шумом.
У ситуації з ідеальністю, кожні півтора секунди боти озиралися на своїх сусідів, а тоді обирали колір, який мав найменше конфліктів з їхніми сусідами. Що ви можете вважати ірраціональною поведінкою. У ситуації з 10% шумом, вони робили це, але 10% часу обирали випадковий колір. А в ситуації з 30% шумом, вони робили це, але 30% часу обирали випадковий колір. Таким чином, ми зробили ботів, скажімо, все більше схильними до помилок, все більш шумними.
А потім ми подивилися на, в нас було, я думаю, приблизно, почнемо з контрольної групи. Ми побудували тут на осі x час, а на осі y ймовірність того, що група в цілому не вирішила гру на координацію. Тож тут, якщо ви поглянете, наприклад, на початку, у нульовий момент часу, [00:08:51] 100% лише людських груп, сесій лише з людьми, представлені в оранжевому. На початку 100% груп, що складаються лише з людей, не вирішили гру. І потім, коли час минає, все більше і більше людських груп вирішують гру, так що до кінця п'яти хвилин, можливо, 60% груп лише з людей вирішили гру.
Отже, що відбувається, якщо ви вставите 10% шумних ботів у центральну позицію мережі, ви отримуєте помітно покращену продуктивність. Тут значно більше груп людей, коли боти, які мали трохи шуму, були додані до середини, змогли вирішити проблему. Насправді, вони зменшили медіанний час рішення з 232 секунд до 103 секунд. І в цих даних є й інші висновки. Ідеальні боти та надто шумні боти були обидва непомічними. Вам потрібна була якась калібровка. Це були 10% шумних ботів, які були найкориснішими. І також позиція ботів мала певний вплив. Але вирішальним у цих експериментах ми також виявили, що люди, які не були підключені до ботів, [00:09:52], які були далі в мережі. Отже, на графіках були деякі люди, які були підключені до ботів, а інші – ні. Ми виявили, що навіть ті люди почали змінювати спосіб, яким вони грали. Отже, був ефект скидання, ефект каскаду. Переваги того, як бот взаємодіяв зі своїми людськими партнерами, розповсюдилися по мережі і почали впливати на людські взаємодії все далі й далі в мережі. Іншими словами, боти допомогли людям допомогти собі, а переваги шуму розподілялися в цій соціальній системі.
Тепер дозвольте мені ще більше прояснити ідеї щодо цього колективного виклику та того, як ці прості AI-агенти можуть допомогти з ще одним аналогією. Уявіть, що у вас є площина. Це як у градієнтному спуску в машинному навчанні, наприклад. Отже, у вас є площина, і ви маєте пагорби та гору. І у вас є різні пагорби, добре, різної висоти. І у вас є гора, яка високо тут, це найвища гора. Отже, я візьму четверо з вас і кину вас кудись сюди, і я зв'яжу вас разом, кожного з вас, що дивиться в різному кардинальному напрямку, [00:10:54] і я вас осліплю. І я скажу вам знайти найвищу гору. Отже, ви, хлопці, розмовляєте один з одним і кажете, що чому б нам не зробити крок у нашому напрямку і звітувати назад команді? Отже, ви робите крок на північ і кажете, що тут підйом. А на південь кажуть, що тут спуск. А схід і захід кажуть, що тут горизонтально. Отже, ви всі погоджуєтеся, давайте зробимо крок на північ. І ви продовжуєте це робити ітеративно, поки не досягнете моменту, коли всі з вас скажуть, що тут спуск.
Чи знайшли ви найвищу гору? Ні. (...) Що ви зробили? Ви знайшли найближчий пагорб.
Тепер ви ніколи не знайдете найвищу гору? Ні. Ви ніколи не знайдете найвищу гору. Ви застрягли. Ви локально оптимізовані, але глобально недооптимізовані. І щоб досягти глобальної оптимізації, вам потрібен трохи шуму. Вам зрідка потрібно дозволити цій групі людей зробити контрінтуїтивний крок вниз по горі або вниз по пагорбу. Тож іноді вони здійснюють послідовність випадкових кроків, поки не повернуться на площину. А тоді вони досліджують усе це ландшафт фітнесу, досліджуючи всі ці вершини, поки не опиняться на цій вершині. [00:11:56] І ця висока версія, глобальний оптимум, має тенденцію бути приймаючим станом, адже для того, щоб зійти з цієї версії, потрібно набагато більше шуму, ніж з будь-яких інших вершин. І отже, тепер ви коливаєтеся навколо глобального оптимуму. Тож у нашій роботі ми досліджували цей вид простого програмування, вставленого в соціальні системи, щоб подивитися, чи можемо ми покращити продуктивність людей у вирішенні різноманітних колективних проблем дій.
Тепер ще одна колективна проблема полягає в іншому виклику, а саме в співпраці, а не в координації. Людям часто потрібно співпрацювати, щоб виробити те, що називається суспільним благом. І маяк — один з класичних прикладів суспільного блага. У суспільного блага є дві класичні характеристики. По-перше, воно є некорисливим. Це означає, що інші не можуть бути завадою у його використанні. Якщо ви збудуєте маяк для власних потреб, адже ви орієнтуєтеся в морі і не хочете натрапити на берег, це чудово для вас, але ви не можете завадити іншим користуватися ним, так? Некорисливе. [00:12:58] Також воно є нерозривним. Це означає, що споживання однією особою не зменшує доступність для інших. Якщо я користуюсь світлом з мого маяка, для вас світла не стане менше. І це на відміну, наприклад, від шматка торта. Якщо в мене є шматок торта, він мій, так? Я можу завадити вам його з'їсти. І якщо я його з'їм, для вас не залишиться жодного, так? Тож суспільне благо має ці характеристики, і саме ці характеристики ускладнюють виробництво суспільних благ. Адже, коли справа доходить до будівництва маяка, дуже спокусливо поставити свої інтереси проти групових. Якщо ви не внесете свій внесок у будівництво маяка, ви все одно зможете з нього скористатися. І всі мають спокусу нічого не робити, в результаті маяк не будується, що шкодить всім. Також варто підкреслити, що суспільні блага корисні, адже їх можна використовувати для створення речей, таких як безпечне морське подорожування. І, таким чином, недостатні інвестиції в суспільні блага є серйозною проблемою в нашому суспільстві, і це також стало відомо як трагедія спільного ресурсу. Ці суспільні блага, наприклад, норми довіри, які ми підтримуємо один до одного, є ефективними. [00:14:01] Згадайте, коли ви навчалися в старшій школі. Дехто з вас ходив до старшої школи, де учні довіряли один одному, і це значило, що ви могли залишати свої рюкзаки в коридорі і не переживати, що їх вкрадуть. Інші з вас ходили до шкіл, де не було тих самих норм довіри, і вам доводилося замикати свій рюкзак або тримати його при собі в будь-який час. У якому з цих двох середовищ, на вашу думку, ви могли б навчатися краще? Правильно? У першому середовищі. Отже, ця норма, що підтримується колективно, є продуктивною. У цьому випадку, продуктивною для навчання. Тут, продуктивною для безпечного морського подорожування і так далі.
Отже, співпраця в людських групах для виробництва суспільних благ є складним завданням, і для її підтримки потрібні різні механізми. Ми провели багато експериментів, в яких людей поміщали в мережеві групи і просили їх грати в різноманітні ігри суспільних благ з їхніми сусідами, маніпулюючи багатьма структурними та іншими характеристиками протягом років. Наприклад, ми розпочали кілька років тому з експерименту, в якому людей розміщували в таку мережу. Їм представляли їхніх сусідів, і вони грали в гру суспільних благ з поведінкової економіки, [00:15:03] де, наприклад, я міг дати трохи грошей кожному з моїх сусідів. Я беру один долар і ділю його між сусідами. Потім вчені подвоюють цей долар. Припустимо, я маю чотирьох сусідів. Припустимо, я маю трьох сусідів, і я даю долар групі. Це стає двома доларами. Ці два долари діляться між усіма чотирма з нас. Отже, вся група отримує багатство в двох доларах, але я повертаю тільки 50 центів. Два розділити на чотири, я отримую назад 50 центів. Тож я мушу пожертвувати для користі інших. Тому природно, що всі кажуть: я не хочу жертвувати. Нехай усі інші дурні дають гроші. Я нічого не дам, і сподіваюсь, що інші вкладуться. Але, звичайно, якщо всі це зроблять, ви отримаєте знову крах. А найкраща поведінка – це коли всі вносять максимальні внески. Отже, в цій ситуації ми розпочинаємо гру. Сині точки – це хороші, співпрацьовні люди. Вони вносять максимально своїм сусідам і створюють суспільні блага, такі як побудова маяка. А червоні точки – це експлуататори, які не роблять внесків, їх також називають дефекторами. І те, що ми знайшли в цьому експерименті, – ми відтворили результат, відомий протягом 30 років, [00:16:03] що співпраця розпадається в групах. Наприкінці гри, через кілька раундів, практично всі стають дефекторами, окрім цих маленьких синіх людей тут збоку, які підтримують цивілізацію живими серед себе. Також можна подумати, знову ж таки, згадуючи про середню школу для студентів. Пам’ятаєте ту ситуацію, коли ваш вчитель з науки призначив чотирьом з вас зробити груповий проєкт, і ви отримували однакову оцінку? І вас призначили з трьома іншими лузерами. Тож тепер у вас є два варіанти. Або ви робите всю роботу, і вони також отримують відмінні оцінки, бо ви хочете A. Або ви кажете: це ж абсурд. Я не хочу, щоб ці ледарі користувалися моєю працею. І ви кажете, що також не будете нічого робити, і всі отримують провали, так? Це жахлива дилема. Ну, що тут відбувається, так це те, що люди зрештою обирають другий варіант. Вони всі обирають отримувати провали, адже не хочуть бути дурнями і продовжувати вносити внески. Тому співпраця в соціальних системах все ж таки розпадається, як загальний результат. Проте, що ми зробили, так це, знову ж таки, ми додали деякі, хоча й різні, боти до системи. Ми додали деякі боти, які мали дуже прості можливості. [00:17:05] І ці боти були схожі на маленьких шлюбних брокерів. Вони посередничили у соціальних взаємодіях. Вони оглядали своїх сусідів, хто з ким взаємодіє, і давали поради людям у системі. Знаєте що? Вам слід обірвати зв'язок з цим дефектором, який користується вами, і замість цього зв'язатися з цим хорошим хлопцем тут. І ця м’яка порада з перепідключення, яка використовує лише локальні знання. Там немає вчителя, який наказує людям бути добрими. Ніякої поліції. Ніякого суду. Жодної централізованої влади, яка це виконує. Лише діячі, які діють на основі локальних знань, і ми виявили, що ці боти могли, в наших експериментах з понад 1,000 людей у 64 групах, ми виявили, що не лише співпраця могла бути стабілізована, але вперше ми показали результати, що співпраця могла насправді зрости з початкового рівня, коли ці типи ботів були додані. І DeepMind згодом відтворила наші результати і розширила їх у іншій статті, що з'явилася приблизно за рік чи два після цієї.
У ще одному експерименті ми вивчали, як роботи можуть вплинути на групову креативність. [00:18:07] тому що знаходити нові ідеї непросто. Теорія та експерименти свідчать, що групи можуть бути краще здатні виявляти та зберігати інновації, ніж окремі особи, обмінюючи свої відкриття.
Але інновації в групах стикаються з власними викликами, включаючи групове мислення. Так? Якщо зібрати групу людей, вони можуть занадто рано зосередитися на підоптимальній ідеї.
Або ви могли б уявити, що група людей може колективно мати більшу мудрість, може вигадати більше ідей. Наприклад, якщо ви дасте групі людей завдання вдосконалити риболовну вудку, знаєте, перша особа може сказати, ну, чому б нам не прикріпити гачок до кінця нитки? А потім людина тримає нитку з гачком. І хтось каже, чому б нам не прикріпити паличку до нитки? О, це чудова ідея. Отже, вони поєднують свої знання і роблять це. І хтось каже, що наживка з гачком плаває на поверхні. Давайте додамо хвилю, щоб вона підійшла вниз. Ну, тепер вона йде занадто далеко вниз. Як щодо того, щоб додати поплавок, щоб ми знали, де вона є, і так далі. І люди інновують, діляться знаннями між собою, зберігають знання протягом часу, [00:19:08] і ви отримуєте ці культурні артефакти, які є складним продуктом кількох людей, що діляться ідеями та проявляють креативність.
Тому ми захотіли створити гру, в якій групи людей шукали б оптимальну ідею в ландшафті. І ми вирішили використовувати іменники як проксі для ідей. Ми взяли 20,000 іменників з класичного корпусу комп'ютерних наук word-to-vec. Отже, ми взяли 20,000 іменників. І відстань між цими іменниками можна було визначити за допомогою метрики косинусної схожості. Ви можете уявити собі гіперрозмірний векторний простір, у якому кіт більше схожий на собаку, ніж на стіл. І вони зробили це, досліджуючи, як часто слова кіт і собака співіснували на вебсайтах. Отже, у них був всесвіт вебсайтів і всесвіт із 20,000 іменників. І вони сказали, що ці два іменники часто співіснують, а ці інші два іменники не часто співіснують. Вони створили 300-вимірний векторний простір. [00:20:08] І тепер ви можете описати, наскільки схожі будь-які два іменники. І ми вирішили використовувати іменники як проксі для ідей. Ми взяли ці 20,000 іменників. А потім ми вибрали набір іменників. Уявіть, що ми вибрали один іменник, але ми вибрали набір. Один іменник випадковим чином з усіх цих, наприклад, braggadocio, був іменником. Отже, ми вибрали braggadocio. І ми кажемо, що це ідея, яку ми хочемо, щоб ця група людей знайшла. І всі іменники, які знаходяться поруч з braggadocio, зникають у цьому векторному просторі. Отже, у вас є піковий іменник, який отримує найбільшу кількість балів, 20,000 балів, а всі інші іменники – до іменників, які найвіддаленіші. І ми поміщаємо людей у цю систему і кажемо, знайдіть це слово. Ми не говоримо їм слово. А потім ми кажемо їм балову вартість слів. Отже, вони починають вгадувати. І поки вони вгадують, вони отримують зворотній зв'язок. І вони кажуть: «О, це слово має більше балів, ніж інше слово». І вони наближаються до істини і починають ділитися знаннями між собою. Вони намагаються бути креативними для вирішення проблеми.
Отже, кожен іменник пов'язаний з іншими в семантичному просторі або в безсмістовному ландшафті. [00:21:10] І в нас було 18 різних цільових іменників, ніби ми підняли пік з ландшафту цих 20 000 іменників у 18 різних місцях в 18 різних ландшафтах. І ці іменники були свідомо незвичайними, такими як братовбивство, швабра, саркома, картографія тощо. А потім ми провели експерименти, що включали кілька умов, де люди були самі, намагаючись орієнтуватися в ландшафті, де люди були в групах, працюючи разом, щоб орієнтуватися в ландшафті, або де люди були в групах, але також були деякі роботи, які намагалися допомогти їм бути креативними. І роботи працювали, бо могли передавати інформацію з одного регіону мережі в інший, спілкуючись один з одним. Отже, наприклад, робот номер два міг передати слово небо або автомобіль роботу номер один. Отже, ось приклад мережі.
Ми впускаємо людей. Квадратні точки – це боти. І цей бот має чотири взаємодії, а цей бот має, я не знаю, шість або сім взаємодій. Люди на початку починають здогадуватися. [00:22:12] У них немає абсолютно ніякої основи для здогадок у першому раунді гри. Вони здогадуються: небо, автомобіль, кролик, пацюк, собака, кіт, стіл. Якби я запитав вас, виберіть іменник для здогадування, ви б здогадалися будинок або сонце, або місяць, чи кіт, чи собаку, або якийсь маленький типовий іменник. І тепер їм повідомляють значення балів, як схоже слово пацюк, собака, кіт, стіл і так далі на саркому. І їм повідомляють значення балів цих іменників щодо цільового іменника, яким є саркома. І потім ці значення балів їм оголошують. І тоді цей бот може подивитися на значення балів людей навколо нього і може передати або випадковий вибір цьому боту, або найвищу, або найнижчу оцінку, свого роду альтернативний канал зв’язку, що поширює інформацію з одного регіону групи людей, які намагаються вирішити проблему, до іншого регіону. Тож давайте розглянемо кілька прикладів, щоб це зрозуміти, тому що це може бути важко для сприйняття. Люди грали в цю гру близько 25 раундів. І ось косинусна схожість з цільовим іменником, яким є слово фратріцид. Добре, отже, є 20 000 іменників. [00:23:13] Фратріцид становить 20 000 балів, а інші слова мають свої бали. І ось одиночна людина, людина сама по собі, яка здогадується. Отже, їх перший здогад – це шматочок. І їм кажуть, наскільки схоже слово шматочок на фратріцид. Потім їхній наступний здогад – це народження. І вони отримують великий приріст у косинусній схожості, адже ви можете уявити, що слово народження ближче до слова фратріцид, ніж слово шматочок. Добре? А потім вони здогадуються. Вони спробують гроші наступними. Це гірше. Потім вони спробують мавпу. Це ще гірше. Вони перевіряють. Вони роблять перевірку на адекватність. Вони намагаються народження. Це знову підвищується. Потім спробують дитину. Це непоганий здогад. Народження до дитини. Але дитина відводить їх далі від фратріциду. А потім леді і так далі. І вони навігають. І вони здогадуються. І вони здогадуються. І вони не наближаються до фратріциду до самого кінця. Тепер у цій іншій ситуації у нас є група людей, але без ботів. І тепер люди можуть, додатково до своїх здогадок, бачити здогадки людей навколо них. І розвивати ідеї інших. Добре? Створюючи. Як разом робити риболовецьку вудку. [00:24:13] Отже, ця особа, їхній перший здогад – це собака. Але їхній наступний здогад – це щит. Ви можете бачити, що щит ближче до фратріциду, ніж собака. І ця особа здогадується і здогадується, отримуючи інформацію від своїх сусідів. І в кінці кінців, він поступово наближається і закінчує зі словом ворог. Добре? Насправді, солдат був його найкращим здогадом. Мав найвищу оцінку під час його траєкторії.
Отже, як додавання ботів вплинуло на результат? Це, знову ж таки, показує підсумок результатів. На осі x — коло. На осі y — середня косинусна схожість у цій гіпер-вимірній векторній області, що є мірою групової продуктивності. І ось група людей, які діють, здогадуються поодинці. Люди, які роблять це самостійно, не справляються дуже добре, правильно? Вони, ви знаєте, це просто випадковість, чи можуть вони якимось чином, або, ви знаєте, якимось вродженим здібностями кожної окремої людини. Вони трохи покращуються з часом, наближаючись. Усі групи перевершують поодиноких. Це стара відома істина. Група людей є більш креативною, ніж аналогічно за розміром набір поодиноких практиків. Але що ми знаходимо, так це те, що якщо ми додамо найбільш схожого бота, бота, який подивився на своїх сусідів, [00:25:17] і виявив, який у них місцевий консенсус щодо цього? Мої люди, здається, вважають, що це хороше слово. А потім передає його боту, що знаходиться на віддаленій частині мережі. Цей бот суттєво покращив продуктивність цієї групи людей для досягнення відкриття. Ви повинні вміти уявити, як це може спрацювати в групі інженерів або будь-яких інших знань. Як, наприклад, можна ефективно розподілити знання, уникаючи групового мислення та сприяючи креативності, створюючи ботів, які допомагають людям допомагати собі. Цей бот тут не має мозку. Він не пропонує ідеї самостійно. Він просто допомагає людям поширювати ідеї між собою.
Отже, прості AI-агенти з інтерпретованою поведінкою можуть покращити здатність до креативного відкриття в групах людей, ділячись ідеями, навколо яких існує місцевий консенсус в одній частині групи, з людьми, які знаходяться в віддаленій частині групи. І в результаті група може працювати краще.
Тепер ми також почали експериментувати з фізичними системами. І ми додали гуманоїдних та негуманоїдних роботів [00:26:19], наділених простою ШІ, до груп людей для обличчя-до-обличчя і показали, як вони можуть полегшити співпрацю груп людей, допомагаючи їм подолати тертя або нездатність до співпраці під час взаємодії. Один з моїх улюблених прикладів цього - експеримент, який я проводив зі своєю колишньою аспиранткою, Меггі Трейгер, яка зараз є асистентом професора в Нотр-Дамі. Цей експеримент був таким: ми взяли трьох справжніх людей, які прийшли в лабораторію, та гуманоїдного робота. І ми розробили маленьку гру, маленьку гру з рейками, яка грається на планшеті, і ця група людей разом із роботом мала завдання укласти колію від точки А до точки Б, ніби маленькі рейки «Тома з паровоза». Потім ми дали їм кілька частин, які вони могли вибрати на планшеті, як прямі та криві шматки. Але ми час від часу вигадували, хоча виглядало так, ніби там є мікс частин, і що принципово вони повинні були б мати змогу перейти з точки А в точку Б, ми підступно спроектували це так, що кількість кривих не відповідала, щоб дозволити їм дістатися з точки А в точку Б. [00:27:21] Отже, вони не могли цього зробити. Вони не могли вирішити цю задачу, не підозрюючи про це. Добре? Спочатку кожна людина по черзі укладала шматок рейки, потім наступна особа і наступна особа. Вони працювали разом, щоб з'єднати точку А з точкою Б на своїх планшетах.
І те, що ми зробили в цьому експерименті, полягає в тому, що ми маніпулювали, і вони грали 30 раундів цієї гри в цьому віртуальному світі, і у нас було 51 група, ми маніпулювали стилем спілкування роботів, зокрема, чи висловлював робот уразливість, визнаючи помилку. Тому робот сказав, знаєте, я зробив помилку. Або чи розповідав робот «татові жарти». Я припускаю, що всі знають, які це «татові жарти». Добре. Отже, ми також змусили робота розповідати, до речі, це культурний універсал, як антропологи в амазонській джунглі вивчали корінні народи, і тати там також розповідають «татові жарти». А діти такі: «Я не можу повірити, що татові тупі жарти». Але все ж таки, насправді є теорія про те, для чого призначені «татові жарти», щоб зміцнити дітей певним чином. Це теорія. Але все ж таки, це зовсім інша тема. У будь-якому випадку, ми змусили наших роботів розповідати «татові жарти» або висловлювати уразливість. [00:28:21] І ми були зацікавлені в тому, щоб дізнатися, чи здатні зміни в мовленні роботів не лише вплинути на те, як люди взаємодіють з роботами, але й на те, як люди взаємодіють один з одним. І ще раз, це відкриває можливість модифікувати соціальні взаємодії за рахунок впровадження штучних агентів у гібридні системи людей та машин.
Отже, ось невеличкий приклад, о, і я не сказав вам результати. Отже, ось що ми маємо, товщина цих ліній вказує на те, скільки людина друга говорить з людиною першою і так далі. Людина перша не говорить з роботом дуже часто. Це тонка лінія. І коли у вас є нейтральні роботи, ви отримаєте цей шаблон. Але коли у вас є вразливий робот, всі ці лінії стають товстішими і вирівнюються. Ми виявили, що вразливий робот збільшував рівність мовлення серед людей, збільшував обсяг мовлення серед людей і, насправді, в окремих результатах, [00:29:22] збільшував задоволення людей у цьому середовищі.
А ось лише один фрагмент двох різних раундів, що ілюструє, як робот спочатку говорить у нейтральному стилі, у пасивному голосі, що майже не впливає на людське спілкування. робот каже, в дуже реґанівському стилі, була допущена помилка.
Але в наступному раунді робот каже: я зробив помилку. І ви можете просто подивитися, що тут відбувається. Давайте подивимося, чи зможемо ми це зробити. (25 секунд пауза) Отже, за багато-багато десятків запусків, це той шаблон, що ми знаходимо. Отже, просте маніпулювання, просте маніпулювання у мовленні робота змінює те, як люди взаємодіють один з одним. [00:30:25] І я не припускаю, що це потребує багато уяви, щоб уявити, як весь спосіб, як ми проектуємо наші чат-боти і все інше, може впливати не лише на приклад Alexa, який я навів вам на початку, на те, як ми ставимося один до одного. Люди, здається, більше довіряють один одному і мають більше задоволення в цій ситуації.
Тепер тут тихо, і я думаю, що це останній експеримент, який я збираюся вам показати, а потім я завершую, в ще одному експерименті ми розробили нову кібер-фізичну платформу для тестування таких соціальних і справді етичних ефектів простих типів ШІ. Оскільки, з огляду на природу проблем колективних дій, залучення ШІ в людські групи може парадоксально і ненавмисно пригнічувати існуючі корисні соціальні норми у людей, такі як ті, що стосуються співпраці та альтруїзму, які ми еволюціонували як вид. Тож у нас є сотні тисяч років природного добору, що працює над нами, щоб зробити нас здатними вирішувати проблеми колективних дій. Отже, питання в тому, чи втратимо ми можливість співпрацювати для вирішення цих проблем, якщо делегуємо частину цієї агенції машинам? Чи будемо ми покладатися на ці машини, і тому тепер ми знижуємо нашу вроджену здатність співпрацювати, координувати та створювати тощо? Отже, в цьому експерименті, співпрацюючи з Хіро Шірато в CMU, ще одним колишнім моїм аспірантом, ми створили платформу, яка включала два маленькі Raspberry Pi, наділені маленькими механічними транспортними засобами, і ми підключили це до програмного забезпечення, яке у нас є, що дозволяє організовувати онлайн-експерименти в масштабах. Отже, люди були вдома, і їм було призначено одну з цих машин, і вони керували цими машинами, щоб зустрітися в дорозі.
і ми змусили їх грати в гру «курка». Отже, в «курці», знаєте, як, хто швидше добереться до іншого боку, той і виграє. Тож ви заохочені не поступатися іншому. Але якщо кожен з вас вибирає не поступатися, то ви зіткнетеся, і обоє отримаєте найгіршу винагороду. Тож що б люди зробили в цій ситуації, якщо ви граєте в повторювану гру «курка», так це швидко вивчили б, як чергувати. Цього разу ваша черга проїхати прямо, я зупинюся і дам вам проїхати, але наступного разу ви зупинитеся і дасте мені проїхати прямо. [00:32:35] Якщо ми егоїстичні, ми просто продовжимо врізатися один в одного, руйнуючи один одного раз за разом, або дурно, ми обидва звернемо вбік, і жоден не отримає переваги у прямому русі. Тож у цій ситуації тут жовта машина вирішує зупинитися, синя машина просто продовжує рухатися без перешкод до іншого боку.
І ми залучили 300 учасників і 150 динамічних пар, і їм платили залежно від того, як швидко вони доходили до іншого боку. А потім ми додали трохи ШІ. Ми додали авто гальмівну допомогу, яка спрацьовувала, коли у вас виникала сигналізація про наближення, коли ви наближалися до іншої машини, вона гальмувала і надавала вам можливість вирішити: о, мені слід з'їхати на узбіччя і пропустити цього хлопця, або навпаки. Або ми додали авто допомогу у керуванні, коли в момент наближення до іншої машини, вона просто відхилялася, зрозуміло? І ми додали мінімальну функцію спілкування, де люди могли сказати дякую або щось подібне. Просто дуже мінімальне спілкування. І спершу ми показали, що авто гальмівна допомога, де автомобілі зупиняються на заздалегідь визначеній відстані перед зіткненням, збільшила людську альтруїзм. [00:33:38] Це означає, що пропускають інших, як жовтий автомобіль тут. Отже, додавання невеликої авто гальмівної допомоги ШІ полегшило людям працювати разом і співпрацювати в цій ситуації. Більше того, дозволяючи людству спілкуватися, це допомагає їм зробити взаємні поступки в умовах авто гальмівної допомоги. З іншого боку, авто допомога у керуванні, коли автомобіль просто відхилявся, повністю заважала виникненню взаємності між людьми на користь максимізації власних інтересів. Люди просто відмовляються від своєї моральної агенції. Вони більше не переймаються. Вони просто дозволяють машині постійно відхилятися, і вони здаються, зрозуміло? Таким чином, всі вроджені етичні здібності, які у людей були, тепер були усунені додаванням ШІ в умовах авто допомоги у керуванні, але посилені в умовах авто гальмівної допомоги. І це також має вас зупинити. Ви повинні подумати, о боже мій, кожна маленька деталь, яку ми робимо, коли програмуємо ці ШІ агенти, може мати добрі чи погані ефекти на природні тенденції людей.
Здатність людей співпрацювати, обирати черги та діяти альтруїстично може атрофуватися, що в кінцевому підсумку призводить до гірших колективних і індивідуальних результатів. [00:34:46] І насправді, коротко кажучи, ШІ може призвести до своєрідної моральної ліні. (..) Ось ще один фінальний приклад тривалої зміни після впливу ШІ в гібридних системах. І це також приклад того, як присутність ШІ може змінити людські взаємодії, навіть коли ШІ більше не бере участі у цих взаємодіях. Отже, у 2016 році DeepMind розробила AlphaGo, і в тому ж році цей агент ШІ зіграв проти Лі Седоля, видатного чемпіона світу з Кореї.
Я дивився матч. Я не можу грати в Го, але визнаю, що це чудова гра. Мій син грає в Го. (.) І я насправді підтримував Лі Седоля. Лі Седоль - як герой у Кореї, як, наприклад, у нас були б видатні спортсмени на коробках з їжею Wheaties і так далі. Як його зображують на маленьких упаковках локшини та на упаковках з зерновими. Мені здається, це величезне досягнення, що в Кореї такий розумний nerd, як я, вважається важливою особою, добре? Отже, він дуже популярний у Кореї. І він виходить на перший матч, і він занадто самовпевнений. [00:35:47] Я можу сказати, що він занадто самовпевнений. І він програє машині, а потім вибачається перед своїми фанатами. Він каже, мені дуже шкода. Це п'ять ігор. Найкращі три з п'яти виграють. Потім він грає у другій грі, і знову програє. І тепер він стає серйозним. Потім він грає в третій грі, і він програє. Він програв змагання.
І ви могли б бачити натовп, а коментатори були захоплені здатністю машини грати в Го, роблячи ці дивні та красиві ходи, деякі з яких пізніше виявили, що їх грали, бо у нас є записи, що існують тисячами років, про матчі Го, що проводилися в китайському імперському дворі. І вони могли знайти: о, Боже мій, це середньовічний хід, який зробила машина. Ми не бачили його так давно.
А потім Ліза Дал повертається на четвертій грі, і він виграє. (..) І я плакала. Я була такою щасливою. (..) Адже в нього була машина, ви знаєте, він повернувся за моїм видом, і він переміг цю прокляту машину. Як це героїчно, я не могла зрозуміти, скільки розумової потужності мало знадобитися Лізі Дал для цього. [00:36:49] В той момент я була в захваті і так пишалася ним за те, що він продовжував намагатися, навіть після того, як програв матч.
Тепер цікаво, що Ліза Дал після інтерв'ю сказала, що її власна гра змінилася після матчу. Отже, знову ж таки, штучний інтелект допомагає людям допомагати собі, гаразд? Він змінює спосіб, яким він грає, через контакт. А подальші дослідження інших вчених розглянули професійних гравців у ґо та вивчили середню якість прийняття рішень. Є певний стандарт у ґо для оцінки того, наскільки добрий хід, і середня новизна, як незвичним є хід. І вони виявили, що коли AlphaGo перемогла світового чемпіона серед людей у 2016 році, у всьому світі гравці в ґо почали робити кращі ходи, які є більш інноваційними, гаразд? Отже, всі люди, які грають у ґо один з одним, змінилися через додавання AlphaGo. Штучний інтелект допомагає людям допомагати собі. Отже, ми продовжуємо працювати над тим, щоб розробити та додати прості боти до цих та інших ситуацій, що стосуються соціальних дилем і проблем колективних дій. [00:37:55] Ми вивчаємо, як боти можуть вплинути на координацію, співпрацю, спілкування, креативність, довіру, навігацію, обмін та евакуацію. І в нашій лабораторії ми не зосереджені на суперрозумному ШІ, як LLM або AlphaGo, щоб замінити людську когніцію, а скоріше на дурному ШІ, щоб доповнити людську взаємодію. Ми не намагаємося винайти суперрозумний ШІ, щоб замінити людську когніцію. Ми винаходимо дурний ШІ, щоб доповнити людську взаємодію. І наш ШІ може бути дурним, тому що люди розумні. Наш ШІ подібний до платини, доданої до реакції органічної хімії. Це просто каталізатор. Все, що нам потрібно, це каталізатор, щоб допомогти групі людей стати кращими.
І, звичайно, важливо визнати, що протилежне також можливе. Соціальна ШІ може бути використана для заподіяння шкоди групам людей. Але наш підхід пропонує ряд інших технічних та концептуальних переваг. По-перше, ці прості боти є зрозумілими і, отже, чітко ілюструють більш широкі можливості та шанси. На відміну від LLM, які є чорними ящиками і ви не знаєте, що вони роблять, я можу точно сказати вам, що робить наш бот. [00:38:58] Він галасливий. Він виступає посередником у знайомствах. Він передає повідомлення в такий дуже специфічний спосіб. По-друге, наші контрольовані експерименти з ботами також можуть дати уявлення про те, як поведінка людей може змінитися на користь. Іншими словами, я можу взяти це з лабораторії і навчити групу людей робити те, що зробили наші боти. У певному сенсі, ви не можете легко навчити групу людей просто робити те, що зробив ChachiPT тут. Ми не знаємо, що робить ChachiPT, але ви знаєте, що вони роблять у нашій ситуації.
Отже, я хотів би завершити, це мій останній слайд, метафорою. Розгляньте ці два об'єкти. Вони обидва зроблені з вуглецю. Якщо ви візьмете атоми вуглецю і з'єднаєте їх одним чином, ви отримаєте графіт, який є м'яким і темним. Візьміть ті ж атоми вуглецю і з'єднайте їх іншим чином, ви отримаєте алмаз, який є твердим і прозорим. І є дві ключові інтелектуальні ідеї. По-перше, ці властивості м'якості та темряви, твердості та прозорості не є властивостями атомів вуглецю. Це властивості колекції атомів вуглецю. І по-друге, які властивості ви отримаєте, залежить від того, як ви з'єднуєте атоми вуглецю один з одним. Візьміть ті ж атоми вуглецю та з'єднайте їх одним чином, ви отримаєте один набір властивостей. [00:40:01] З'єднайте їх іншим чином, ви отримаєте зовсім інший набір властивостей. Подібно, природа наших зв'язків впливає на властивості наших соціальних груп. Це зв'язки між людьми можуть зробити ціле більшим за суму його частин. Нові властивості, такі як співпраця та насильство, інновації та продуктивність, довіра та недовіра, істина та брехня, багатство та бідність, здоров'я та щастя, можуть виникати й поширюватися завдяки зв'язкам, завдяки зв'язкам між людьми, а не лише завдяки самим людям. Насправді, наш досвід світу залежить від структури та функцій мереж навколо нас, близько і далеко. І наш вид еволюціонував, щоб це був випадок. І не слід дивуватися, що ми реагуватимемо на ШІ у нашому середовищі. Дуже дякую.