Nicholas Christakis – Konference om Samfundscentreret AI

Nicholas Christakis: [00:00:05] Okay, så mennesker er indlejret i sociale netværk, og disse netværk følger meget specifikke matematiske, biologiske og sociale principper. Og i stigende grad tilføjer vi kunstig intelligens i form af online agenter og fysiske robotter blandt os, som interagerer med os, som om de var sociale enheder. Og disse typer agenter, som vi vil tilføje til vores systemer, spænder fra førerløse biler på vejene til kasseapparater i butikker, til humanoide robotter i hjemmet eller i fabrikker eller på slagmarker eller i brandslukningssituationer, til frakoblede autonome agenter såsom online bots og digitale AI-assistenter i vores telefoner eller vores briller eller på vores arbejdspladser. Og disse teknologier interagerer med os på en ligeværdig måde, som om de var mennesker. Og de vil give anledning til hybride systemer af mennesker og maskiner. Og disse systemer tilbyder muligheder for en ny slags social kunstig intelligens.

Nu, lad mig give dig et lille eksempel på dette. Når du får en digital assistent, som en Alexa, er producenten af den enhed meget opmærksom på menneske-maskine-interaktionen. Og den menneske-maskine-interaktion er optimeret. For eksempel ville du aldrig købe Alexa, hvis du hver gang du havde brug for noget fra den, skulle sige, undskyld mig, Alexa, jeg er meget ked af at afbryde dig. Hvis du ikke har noget imod det, ville du så ikke være sød at fortælle mig ordet? [00:01:35] vejret i morgen, ikke? Dette ville blive betragtet som et absurd niveau af høflighed. Du forventer at kunne sige, Alexa, vejret, og så svarer maskinen lydigt. Og det er fint, indtil du bringer den maskine ind i dit hus, og dine børn taler til den maskine og lærer at være uhøflige. Og så går de til legepladsen, og de er uhøflige over for andre børn. Så den maskine, der er blevet tilføjet til vores midte, handler ikke kun om menneske-maskine-interaktionen, det handler om menneske-menneske-interaktionen i nærvær af maskiner. Og hvad jeg er interesseret i, er ikke, hvad det er, men menneske-menneske-interaktionerne i nærvær af maskiner. Og vi kan bruge en forståelse af den sociale netværksstruktur og funktion til at vurdere brugen og indvirkningen af social AI inden for og på menneskelige grupper, med respekt til faktorer som tillid og samarbejde, der er nødvendige for at grupper af mennesker kan arbejde sammen, uh, og som påvirker adfærden i disse kollektiviter.

Lad mig fremhæve noget af det arbejde, vi gør, ved at anvende flere tilgange til netværksforsøg, der involverer, øh, kunstig intelligens. Disse eksperimenter vurderer, hvordan AI kunne påvirke strukturen og funktionen af menneskelige sociale interaktioner. [00:02:45] Der er en klasse af kollektive handlingsproblemer i sociale interaktioner, som vi har, der er kendt som koordinationsproblemer. Det vil sige, at disse er problemer, hvor vi skal arbejde sammen for at skabe noget, der er nyttigt. Og nogle gange løser vi disse problemer ved at oprette centraliserede institutioner som politi eller domstole eller regeringer. Men ofte kan vi løse kollektive handlingsproblemer, der kræver, at vi koordinerer eller samarbejder med mange mennesker på en decentraliseret måde. Vi har faktisk udviklet denne kapacitet. Og en specifik type kollektiv handlingsproblem, som jeg gerne vil starte med i dag, er faktisk koordinering.

Så for eksempel, for at undgå denne trafikprop, skal folk koordinere for at gøre noget forskelligt fra deres naboer. Så hvis alle forlader deres hus på samme tid, sidder alle fast i en trafikprop. Men hvis de justerer deres afgangstider og forlader over intervaller, så er ingen i trafikproppen. Nu, selvfølgelig, kunne du have en slags central autoritet, der koordinerede dette. I skal tage af sted først, så I, og så I. [00:03:45] Men ideelt set vil man gerne have en eller anden form for decentraliseret, ikke-top-down måde for mennesker at koordinere for at løse dette problem.

Så her var vores første eksperiment, der blev offentliggjort i 2017 om sådanne hybride systemer, der udforskede, hvordan AI kunne hjælpe med denne udfordring. Og vi undersøgte præstationen af menneskelige grupper, der var engageret i en koordinationsopgave. Vores paradigme var at låne fra datalogi noget kendt som grafcolorering. Dette er et klassisk problem inden for datalogi. Men hvad vi gjorde var, at vi tog det og satte mennesker i den situation. Så hvad vi gjorde var, at vi tog 4.000 mennesker og satte dem i 230 online grupper. Disse mennesker blev indsat i disse grupper. Og de blev tilfældigt tildelt en plads inden for et kunstigt netværk, som vi skabte, og strukturen af dette mindede groft om rigtige menneskelige netværk. Og de blev indsat i disse pladser og blev fortalt, at de var tildelt en af tre farver, [00:04:46] en lilla, orange, lilla, orange og pink. Og de blev fortalt, at de skulle vælge en farve, der var forskellig fra deres naboer.

Og de fik fem minutter til at gøre det. Så ville disse mennesker se sig omkring på deres naboer. Hver person ville kigge rundt, og de ville sige, for eksempel, denne fyr her er pink. Han ser, at han har en pink nabo og en orange nabo. Hvad han skal gøre, er at skifte til den lilla farve. Og de røde linjer her angiver farvekonflikter. Med andre ord, hvis de to farver på tilstødende noder er de samme, får de en rød linje. Og de baggrunds-lilla linjer angiver strukturen af de sociale interaktioner. Så du sætter folkene herinde. De ser sig omkring på deres naboer hvert sekund eller sekund og et halvt. De laver et skift i overensstemmelse med målet om, at alle skal vælge en farve, der er forskellig fra deres naboer i løbet af de næste fem minutter. Og hvis de gør det, så og kun så vil de blive betalt. Jeg vil betale jer for at arbejde sammen. Og hvis I alle arbejder sammen på en decentral måde for at løse problemet, så får I alle betalt. Ellers får I intet, okay? Så her er hvad der sker i dette eksperiment. Her på x-aksen er tiden i sekunder op til fem-minutters mærket. [00:05:47] Spillet varer fem minutter, nede over her et sted. Og her på y-aksen er målfunktionen eller antallet af farvekonflikter. Og så her i starten er der 12 farvekonflikter. De får tilfældigt tildelt deres startfarver. Og det vises her på dette lille histogram lige der. Og så begynder folk at se sig omkring og skifte deres farver. Du ved, de skifter, og de skifter. Og de når til dette punkt her, hvor de nu har nået en situation, hvor der er en farvekonflikt mellem disse to personer. Og denne konflikt, men, hvad vi kalder en uoprettelig konflikt. Så de lyse orange linjer er resolvable konflikter. Det er denne fyr her. Han kan lave et træk til lilla, der løser konflikten. Men disse fyre her, der er orange, er der ingen træk, de kan lave, der reducerer antallet af farvekonflikter i deres nabolag, ikke sandt? Denne fyr kan ikke skifte til lilla, fordi, faktisk, hvis han skifter til lilla, vil han have flere konflikter. Han har, ligesom, fire lilla naboer. Og han kan ikke skifte til pink, fordi han har to pink naboer. Så han kigger og siger, godt, den mindste konflikt jeg har, er bare at blive orange. Så nu er denne gruppe fastlåst, ikke? [00:06:49] De har en uoprettelig konflikt, og der kan ikke ske noget. Ingen fremskridt kan gøres i løsningen af det kollektive handlingsproblem, før en af disse to personer foretager et kontraintuitivt træk, skifter farver til lilla eller pink, og midlertidigt øger konflikterne. Og det er faktisk, hvad der sker. Og så går tiden, og menneskene ved 245 sekunder løser problemet. Maskinen opdager løsningen, stopper spillet og betaler dem, okay?

Nu, fordi vi var snedige, hvad vi gjorde var, at vi udførte nogle eksperimenter, hvor vi hemmeligt erstattede nogle af menneskene med bots. Og vi evaluerede, hvordan tilføjelsen af AI-udrustede bots til at skabe et hybrid system påvirkede gruppepræstationen. Er det muligt at tilføje nogle bots til menneskegrupper og forbedre deres evne til at koordinere, når de står over for en sådan udfordring? Og hvad vi gjorde, var, at vi tilføjede tre bots, og vi eksperimenterede med to akser. Hvor botsene blev placeret, hvor de tilfældigt blev lukket ind i netværket, hvor de blev sat ind i [00:07:51] midten af netværket, eller hvor de blev sat ind i periferien af netværket. Og vi manipulerede tilfældigt med deres form for AI-kapacitet her på en meget triviel og simpel måde. Nemlig, vi manipulerede med, om botsene agerede perfekt eller agerede med lidt støj.

I perfektion situationen, hver halvandet sekund, kiggede botsene rundt på deres naboer, og så valgte de den farve, der havde færrest konflikter med deres naboer. Hvad du måske ville tænke på som irrationel adfærd. I 10% støjsituation, gjorde de det, men 10% af tiden, valgte de en tilfældig farve. Og i 30% støjsituation, gjorde de det, men 30% af tiden, valgte de en tilfældig farve. Så vi gjorde botsene, lad os sige, mere og mere fejlbarlige, mere og mere støjende.

Og så kiggede vi på, vi havde, jeg tror, noget som, lad os starte med en kontrolgruppe. Vi plottede her på x-aksen er tid, og disse er overlevelseskurver. På y-aksen er sandsynligheden for, at gruppen som helhed ikke har løst koordinationsspillet. Så her, hvis du kigger her, for eksempel i begyndelsen, ved tid nul, [00:08:51] 100% af de eneste menneskegrupper, sessionerne med kun mennesker, er i orange. I begyndelsen har 100% af de menneske-only grupper ikke løst spillet. Og så som tiden går, løser flere og flere af menneskegrupperne spillet, sådan at ved slutningen af de fem minutter, måske 60% af de menneske-only grupper har løst spillet.

Nå, hvad der sker, er, at hvis du sætter 10% støjende bots i den centrale position i netværket, får du mærkbart forbedret ydeevne. Her var betydeligt flere grupper af folk i stand til at løse problemet, når bots, der havde en smule støj, blev tilføjet til midten. Faktisk reducerede de den mediane løsningstid fra 232 sekunder til 103 sekunder. Der er også andre fund i disse data. Perfekte bots og alt for støjende bots var begge til ingen nytte. Du havde brug for en vis kalibrering. Det var de 10% støjende bots, der var de mest hjælpsomme. Og også positionen af bots havde en vis indvirkning. Men vigtigt i disse eksperimenter fandt vi også, at mennesker, som ikke var forbundet til bots, [00:09:52] som var længere væk i netværket. Så i graferne var der nogle mennesker, der var forbundet til bots, og så nogle andre, som ikke var. Vi fandt, at selv de mennesker begyndte at ændre den måde, de spillede på. Så der var en ripple-effekt, en kaskadeffekt. Fordelene ved, hvordan boten interagerede med sine mennesker, spredte sig gennem netværket og begyndte så at påvirke menneske-menneske interaktioner længere og længere væk i netværket. Med andre ord, bots hjalp mennesker til at hjælpe sig selv, og fordelene ved støjen spredte sig inden for dette sociale system.

Lad mig nu yderligere afklare ideer angående denne kollektive udfordring, og hvordan disse enkle AI-agenter muligvis kan hjælpe med en anden analogi. Forestil dig, at du har et plan. Dette er som gradient descent i maskinlæring, for eksempel. Så du har et plan, og du har bakker og et bjerg. Og du har forskellige bakker, okay, med forskellige højder. Og du har et bjerg heroppe, der er det højeste bjerg. Så du bliver droppet, jeg tager fire af jer, og jeg droppede jer et sted her, og jeg håndjernede jer sammen, hver af jer ser i en anden kardinalretning, [00:10:54] og jeg blindede jer. Og jeg siger til jer, find det højeste bjerg. Så I taler sammen og siger, hvorfor tager vi ikke hver især et skridt i vores retning og rapporterer tilbage til holdet? Så du tager et skridt mod nord, og du siger, det går op ad herfra. Og syd siger, det går ned ad herfra. Og øst og vest siger, det er sidelæns herfra. Så I enes om, lad os tage et skridt mod nord. Og I fortsætter med at gøre dette iterativt, indtil I når et punkt, hvor I alle siger, det går ned ad herfra.

Har du fundet det højeste bjerg? Nej. (...) Hvad har du gjort? Du har fundet den nærmeste bakke.

Vil du nogensinde finde det højeste bjerg? Nej. Du vil aldrig finde det højeste bjerg. Du er fastlåst. Du er lokalt optimeret, men globalt sub-optimeret. Og for at kunne optimere globalt, har du brug for lidt støj. Du skal lejlighedsvis tillade denne gruppe af mennesker at tage et kontraintuitivt skridt ned ad bjerget eller ned ad bakken. Så de tager nogle gange tilfældigvis en sekvens af skridt, indtil de kommer tilbage på planet. Og så navigerer de rundt om denne fitnesslandskab, og udforsker alle disse toppe, indtil de ender på denne top. [00:11:56] Og denne høje top tendens, det globale optimum, har tendens til at være en modtagelsestilstand, fordi det kræver meget mere støj at komme væk fra denne top end fra de andre toppe. Og så oscillerer du nu rundt om det globale optimum. Så i vores arbejde har vi udforsket denne form for simpel programmering indsat i sociale systemer for at se, om vi kan forbedre menneskers præstation i forhold til forskellige former for kollektive handlingsproblemer.

Nu er et andet kollektivt handlingsproblem involveret, som er en anden udfordring, nemlig samarbejde, ikke koordinering. Mennesker skal ofte samarbejde for at producere, hvad der kaldes et offentligt gode. Og et fyrtårn er et af de kanoniske eksempler på et offentligt gode. Offentligt gode har to kanoniske egenskaber. Først og fremmest, det er hvad der kaldes ikke-ekskluderbart. Og det betyder, at andre personer ikke kan forhindres i at bruge det. Hvis du bygger et fyrtårn for din egen personlige skyld, fordi du navigerer på havet og ikke vil crash ind i kysten, så er det godt for dig, men du kan ikke stoppe andre fra at bruge det, okay? Ikke-ekskluderbart. [00:12:58] Og desuden, det er ikke-rivaliserende. Det betyder, at forbrug af én person ikke reducerer forbrug af andre. Hvis jeg bruger lyset fra mit fyrtårn, er der ikke mindre lys til dig at bruge. Og dette er i modsætning til, for eksempel, et stykke kage. Hvis jeg har et stykke kage, er det mit, rigtigt? Jeg kan forhindre dig i at spise det. Og hvis jeg spiser det, er der intet tilgængeligt for dig, okay? Så offentligt gode har disse egenskaber, og det er disse egenskaber, der gør det meget vanskeligt at producere offentlige goder. For når det kommer til at bygge et fyrtårn, er det meget fristende at stille dine individuelle interesser mod grupperne. Hvis du ikke bidrager til at bygge fyret, kan du stadig drage fordel af det. Og så er alle fristet til at gøre ingenting, og så bliver fyrtårnet ikke bygget til skade for alle. Og det er også værd at understrege, at offentlige goder er nyttige, fordi man faktisk kan producere ting med dem, såsom sikker sørejse. Og som sådan er underinvesteringen i offentlige goder et alvorligt problem i vores samfund og er også blevet kendt som tragedien i fællesarealerne. Disse offentlige goder, for eksempel, normer for tillid, som vi opretholder blandt os er effektive. [00:14:01] Tænk på, da du var i high school. Nogle af jer gik på en high school, hvor eleverne stolede på hinanden, og det betød, at I kunne lade jeres rygsække stå alene i gangen uden at bekymre jer for, at nogen ville stjæle dem. Andre af jer gik på high schools, hvor der ikke var de samme normer for tillid, og nu måtte I låse jeres rygsæk eller have den med jer hele tiden. I hvilken af de to omgivelser tror du ville du have bedre læring? Rigtigt? I den første omgivelser. Så den norm, der kollektivt opretholdes, er produktiv. I dette tilfælde, produktiv for læring. Her, produktiv for sikker sørejse og så videre.

Så samarbejde i menneskelige grupper for at producere offentlige goder er udfordrende, og forskellige mekanismer er nødvendige for at opretholde det. Vi har udført mange eksperimenter, der involverer at placere mennesker i netværksgrupper og bede dem om at spille forskellige slags offentlige goder-spil med deres naboer, ved at manipulere mange strukturelle og andre træk gennem årene. Så for eksempel begyndte vi for år tilbage med et eksperiment, hvor folk blev sat ind i et netværk som dette. De blev introduceret for deres naboer, og de spillede et offentligt goder-spil fra, som, adfærdsøkonomi, [00:15:03] hvor jeg kunne give lidt penge til hver af mine naboer. Jeg tager en dollar, og jeg deler den mellem mine naboer. Og så fordobler videnskabsfolkene dollaren. Så lad os sige, at jeg har fire naboer. Lad os sige, at jeg har tre naboer, og jeg giver en dollar til gruppen. Det bliver to dollars. De to dollars bliver delt mellem os fire. Så hele gruppen får rigdom ved to dollars, men jeg får kun 50 cent tilbage. De to divideret med de fire, jeg får 50 cent tilbage. Så jeg må ofre noget for andres skyld. Så naturligvis siger alle, jeg vil ikke ofre. Lad hver anden idiot give pengene. Jeg vil ikke give noget, og forhåbentlig vil andre bidrage. Men selvfølgelig, hvis alle gør det, får man en sammenbrud igen. Og den bedste adfærd er, hvis alle bidrager maksimalt. Så her i denne situation starter vi spillet. De blå prikker er, de blå personer er de venlige samarbejdsvillige personer. De giver maksimalt til deres naboer, og de skaber offentlige goder, som at bygge fyrtårnet. Og de røde prikker er udnytterne, der ikke giver nogen bidrag, også kendt som defektorer. Og hvad vi finder i dette eksperiment er, at vi reproducerer et resultat, der har været kendt i 30 år, [00:16:03] som er, at samarbejde kollapser i grupper, ikke? Ved slutningen af spillet, flere runder senere, bliver stort set alle til en defektor, undtagen disse små blå mennesker her på siden, der holder civilisationen i live, du ved, blandt sig selv. Du kan også tænke på, igen, for at nævne gymnasiet for de studerende. Husk den situation, hvor din biologilærer tildelte fire af jer at lave et gruppeprojekt, og I ville få den samme karakter. Og du blev tildelt til tre andre tabere. Så nu har du to valg. Enten laver du alt arbejdet, og de får også A'er, fordi du ønsker en A. Eller du siger, det er latterligt. Jeg vil ikke have disse dovne fyre til at drage fordel af mit hårde arbejde. Og du siger, jeg vil ikke lave noget heller, og I får alle karakteren F, ikke? Det er et forfærdeligt dilemma. Nå, hvad der sker her er, at mennesker til sidst vælger den sidste mulighed. De vælger alle at få F'er, fordi de ikke vil være idioter og fortsætte med at bidrage. Så samarbejde kollapser i sociale systemer som et generelt resultat. Men hvad vi gjorde var, at vi endnu en gang tilføjede nogle, om end forskellige slags Bots til systemet. Vi tilføjede nogle Bots, der var udstyret med meget enkel A. [00:17:05] Og disse Bots var ligesom små ægteskabsmeglere. De mægler sociale interaktioner. De kiggede rundt omkring sig lokalt på, hvem der interagerede med hvem, og de gav forslag til folk i systemet. Du ved hvad? Du bør bryde båndet til den defektor, der udnytter dig, og danne et bånd til denne flinke fyr herovre i stedet. Og denne milde omledningsrådgivning, der kun anvender lokal viden. Der er ingen lærer der beordrer folk til at være venlige. Ingen politi. Ingen domstol. Ingen central myndighed, der udfører dette. Bare handler på lokal viden, fandt vi, at disse Bots kunne, i vores eksperimenter med over 1.000 mennesker i 64 grupper, ikke kun stabilisere samarbejdet, men for første gang nogensinde viste vi et resultat, der viste, at samarbejdet faktisk kunne øges fra basislinjen, når disse typer Bots blev tilføjet. Og DeepMind efterfølgende replikerede vores resultater og udvidede dem i et andet papir, der dukkede op omkring et år eller to efter dette.

I et endnu et eksperiment udforskede vi, hvordan bots kunne påvirke gruppe kreativitet. [00:18:07] fordi det er svært at finde nye ideer. Teori og eksperimenter antyder, at grupper muligvis bedre kan identificere og bevare innovationer end enkeltpersoner ved at dele deres opdagelser.

Men innovation inden for grupper står over for egne udfordringer, herunder gruppetænkning. Rigtigt? Hvis du sætter en gruppe mennesker sammen, kan de for tidligt konvergere på en suboptimal idé.

Eller du kunne forestille dig, at en gruppe mennesker kollektivt kunne have større visdom, kunne være i stand til at komme op med flere ideer. For eksempel, hvis du giver en gruppe mennesker opgaven at perfektionere en fiskestang, så ved du, at den første person måske siger, jamen, hvorfor sætter vi ikke en krog i enden af noget snor? Og så holder personen snoren med en krog. Og nogen siger, hvorfor sætter vi ikke en stok til snoren? Åh, det er en god idé. Så de kombinerer deres viden og gør det. Og nogen siger, jamen, agnen med kroken flyder på overfladen. Lad os tilføje en bølge, så den går ned. Nå, nu går den for langt ned. Hvad med, at vi tilføjer en bobber, så vi ved, hvor den er, og så videre. Og så innoverer folk, deler viden indbyrdes, bevarer viden over tid, [00:19:08] og du får disse kulturelle artefakter, der er det sammensatte produkt af flere personer, der deler ideer og er kreative.

Så vi ønskede at skabe et spil, hvor grupper af mennesker søgte i et landskab efter en optimal idé. Og vi besluttede at bruge substantiver som en proxy for idéer. Vi tog 20.000 substantiver fra det klassiske computer science word-to-vec corpus. Så vi tog 20.000 substantiver. Og afstanden mellem disse substantiver kunne defineres ved hjælp af cosine similarity metrik. Du kan forestille dig et hyperdimensionelt vektorrum, hvor kat er mere lig hund end det er til skrivebord. Og måden, de gjorde dette på, var ved at se på, hvor ofte ordene kat og hund co-optrådte på websteder. Så de havde et univers af websteder og et univers af 20.000 substantiver. Og de sagde, at disse to substantiver ofte co-optrådte, og disse to andre substantiver co-optrådte ikke ofte. De skabte et 300-dimensionelt vektorrum. [00:20:08] Og nu kan du beskrive, hvor like er to substantiver. Og vi besluttede at bruge substantiver som en proxy for idéer. Vi tog disse 20.000 substantiver. Og så valgte vi et sæt af substantiver. Forestil dig, at vi valgte ét substantiv, men vi valgte et sæt. Ét substantiv tilfældigt fra alle disse, som braggadocio, for eksempel, var et substantiv. Så vi valgte braggadocio. Og vi siger, at det er den perfekte idé, som vi vil have denne gruppe mennesker til at finde. Og så falder alle de substantiver, der er tæt på braggadocio, væk i dette vektorrum. Så du har det toppsubstantiv, der får flest point, 20.000 point, og alle de andre substantiver til de substantiver, der er længst væk. Og vi putter menneskelige væsener ind i dette system og siger, find dette ord. Vi fortæller dem ikke ordet. Og så fortæller vi dem pointværdien af ordene. Så de begynder at gætte. Og mens de gætter, får de feedback. Og de siger, ah, dette ord har flere point end et andet ord. Og de kommer tættere og tættere på, og de begynder at dele viden med hinanden. De prøver at være kreative for at løse problemet.

Så hver substantiv er relateret til andre i et semantisk rum eller et uhyggeligt landskab. [00:21:10] Og vi havde 18 forskellige mål-substantiver, som om vi trak et bjerg op fra landskabet af disse 20.000 substantiver på 18 forskellige steder i 18 forskellige landskaber. Og disse substantiver var bevidst usædvanlige, som fratricid, skohorn, sarkom, kortlægning og så videre. Og så udførte vi eksperimenter involverende flere betingelser, hvor folk var alene og prøvede at navigere i landskabet, hvor folk var i grupper og arbejdede sammen for at navigere i landskabet, eller hvor folk var i grupper, men også havde nogle bots derinde for at hjælpe dem med at være kreative. Og bots fungerede, fordi de kunne videregive information fra en region af netværket til en anden ved at kommunikere med hinanden. Så for eksempel kunne bot nummer to videregive ordet himmel eller bil til bot nummer et. Så her er et netværkseksempel.

Vi bringer folk ind. De firkantede prikker er bots. Og denne bot har fire interaktioner, og denne bot har, jeg ved ikke, seks eller syv interaktioner. Menneskene starter med at gætte. [00:22:12] De har slet ingen basis for et gæt i den første runde af spillet. De gætter på himmel, bil, kanin, rotte, hund, kat, skrivebord. Hvis jeg bad jer om at vælge et substantiv at gætte, ville I gætte hus eller sol eller måne eller kat eller hund eller et lille typisk substantiv. Og nu bliver de fortalt pointværdien, altså hvor lignende ordet rotte, hund, kat, skrivebord osv. er i forhold til sarcoma. Og så bliver de fortalt pointværdien af disse substantiv i relation til det målrettede substantiv, som er sarcoma. Og derefter bliver disse pointværdier annonceret til dem. Og så kan denne bot se på pointværdierne for menneskene omkring den og kan viderebringe enten et tilfældigt valg til denne bot eller den højeste pointværdi eller den laveste pointværdi, en slags bagdørs kommunikationskanal, der spreder information fra en gruppe mennesker, der forsøger at løse problemet, til en anden gruppe. Så lad os se på nogle eksempler for at kunne forstå dette bedre, fordi det kan være svært at forstå. Folk spillede dette spil i omkring 25 runder. Og her er cosine-ligheden med et målrettet substantiv, som er ordet fratricide. Okay, der er 20.000 substantiver. [00:23:13] Fratricide har 20.000 point. Og de andre ord har andre point. Og her er en enkelt person, en person alene, der gætter. Så deres første gæt er bit. Og de får at vide, hvor lignende ordet bit er i forhold til fratricide. Og så er deres næste gæt fødsel. Og de får et stort løft i cosine-ligheden, fordi man kan forestille sig, at ordet fødsel er tættere på ordet fratricide end ordet bit. Okay? Og så gætter de. De prøver penge næste gang. Det er dårligere. Så prøver de abe. Det er endnu værre. De tjekker. De laver en sundhedstjek. De prøver fødsel. Det hopper op igen. Så prøver de baby. Det er ikke et dårligt gæt. Fødsel til baby. Men baby tager dem længere væk fra fratricide. Og så dame og så videre. Og de navigerer. Og de gætter. Og de gætter. Og de gætter. Og de kommer ikke tættere på fratricide til sidst. Nu i denne anden situation har vi en gruppe mennesker, men ingen bots. Og nu kan folk, udover at lave deres egne gæt, se gættene fra folkene omkring dem. Og bygge videre på andres ideer. Okay? Skabt. Som at lave fiskestangen sammen. [00:24:13] Så denne person, deres første gæt er hund. Men deres næste gæt er skjold. Man kan se, at skjold er tættere på fratricide end hund er. Og denne person gætter og gætter og får input fra sine naboer. Og til sidst kommer de tættere og tættere. De ender med ordet fjende. Okay? Faktisk var soldat deres bedste gæt. Havde den højeste pointværdi under deres forløb.

Så hvordan betydede det at tilføje robotterne? Dette viser igen opsummeringen af resultaterne. På x-aksen er runden. På y-aksen er gennemsnittet af kosinusligheden i dette hyperdimensionale vektorrum, hvilket er et mål for gruppepræstation. Og her er en gruppe mennesker, der handler, gætter alene. Så de mennesker, der gætter på egen hånd, klarer sig ikke særlig godt, ikke? De, de, du ved, det er bare tilfældigt, om de kan på en eller anden måde, eller, du ved, en iboende evne i hver enkelt menneske. De bliver lidt bedre med tiden, når de kommer tættere. Alle grupper overgår de solo. Og dette er et gammelt resultat, der er kendt. En gruppe mennesker er mere kreativ end et ellers lignende sæt af soloudøvere i samme størrelse. Men hvad vi finder er, at hvis vi tilføjer den mest lignende robot, robotten der kiggede på sine naboer, [00:25:17] og fandt, hvad der er deres lokale konsensus her? Mine mennesker synes at tænke, at dette er et godt ord. Og så sender den det videre til robotten i en fjern del af netværket. Den robot forbedrede væsentligt præstationen af denne gruppe mennesker for at lave en opdagelse. Du bør kunne forestille dig, hvordan dette kunne fungere i en gruppe ingeniører eller andre vidensarbejdere. Hvordan, ligesom, du kan distribuere viden på en effektiv måde, undgå gruppetænkning og fremme kreativitet ved at designe robotter, der hjælper mennesker til at hjælpe sig selv. Robotten her har ikke, har ikke en hjerne. Den tilbyder ikke selv forslag. Den hjælper bare mennesker med at sprede ideerne blandt sig selv.

Så enkle AI-agenter med fortolkeligt adfærd kan styrke kapaciteten til kreativ opdagelse i menneskegrupper ved at dele ideer, omkring hvilke der er lokal konsensus i en del af gruppen med mennesker i en fjern del af gruppen. Og som et resultat kan gruppen præstere bedre.

Nu har vi også begyndt at eksperimentere med fysiske systemer. Og vi har tilføjet humanoide og ikke-humanoide robotter [00:26:19], der er udstyret med simpel AI til ansigt-til-ansigt grupper af mennesker og vist, hvordan de kan lette samarbejdet mellem grupper af mennesker ved at hjælpe dem med at overvinde friktion eller en manglende evne til at samarbejde i deres interaktioner. Et af mine yndlingseksempler på dette er et eksperiment, jeg lavede med min tidligere kandidatstuderende, Maggie Traeger, som er bagved og nu er assistentprofessor ved Notre Dame. Dette eksperiment, vi tog tre rigtige mennesker, der kom ind i laboratoriet, og en humanoid robot. Vi designede et lille spil, et lille jernbanespor-spil, der spilles på en tabletcomputer, og denne gruppe af mennesker og en robot havde til opgave at lægge jernbanespor fra punkt A til punkt B, ligesom små Thomas the Tank Engine jernbanespor. Og så gav vi dem nogle stykker, som de kunne vælge fra på tabletten, som lige stykker og buede stykker. Men vi konstruerede lejlighedsvis, selvom det så ud som om der var en blanding af stykker og at de i princippet skulle kunne gå fra punkt A til punkt B, vi havde bandlyst det, så de ikke var det rette antal buer til at tillade dem at komme fra punkt A til punkt B. [00:27:21] Så de kunne ikke gøre det. De kunne ikke løse problemet uden at vide det. Okay? Så først ville hver person tage en tur med at lægge et stykke spor, så den næste person og den næste person. De arbejder sammen for at forbinde punkt A til punkt B på deres tablets.

Og hvad vi gjorde i dette eksperiment var, at vi manipulerede, og de spillede 30 runder af dette spil i denne virtuelle verden, og vi havde 51 grupper, vi manipulerede den samtalestil, som robotterne anvendte, specifikt om robotten udtrykte sårbarhed ved at anerkende en fejl. Så robotten sagde, du ved, jeg lavede en fejl. Eller om robotten fortalte far-jokes. Jeg går ud fra, at alle ved, hvad far-jokes er. Okay. Vi fik også robotten til at fortælle, for øvrigt, det er et kulturelt universelt, som antropologer i den amazonske jungle har set på blandt oprindelige folk, og fædrene der fortæller også far-jokes. Og børnene er sådan, jeg kan ikke tro, at fars dumme vittigheder. Men anyway, og faktisk er der en teori om, hvad far-jokes er designet til at hærde børnene på en måde. Dette er en teori. Men anyway, det er en helt anden tangent. Anyway, vi fik vores robotter til at fortælle far-jokes eller udtrykke sårbarhed. [00:28:21] Og det, vi var interesserede i at finde ud af, var, om ændringer i robotternes tale havde magten til ikke kun at påvirke, hvordan folk interagerer med robotter, men også hvordan folk interagerer med hinanden. Og igen tilbyder dette udsigten til at ændre sociale interaktioner ved at introducere kunstige agenter i hybride systemer af mennesker og maskiner.

Så her er et lille eksempel på, åh, og jeg fortalte ikke resultaterne. Her er, her er når vi har, så disse, tykkelsen på disse linjer, vi sætter videokameraer op til at overvåge, hvem der taler med hvem, og hvor meget de taler. Og tykkelsen på disse linjer indikerer, hvor meget person to taler til person et, og så videre. Så person et taler ikke meget til robotten. Det er en tynd linje. Og når du havde neutrale robotter, får du dette mønster. Men når du havde den sårbare robot, bliver alle disse linjer tykkere, og de udlignes. Så vi fandt ud af, at en sårbar robot øgede ligheden i tale blandt menneskerne, øgede lydstyrken i tale blandt menneskerne, og faktisk, i separate resultater, [00:29:22] øgede tilfredsheden hos menneskerne i den slags miljø.

Og her er bare et klip af to forskellige runder, der illustrerer, at robotten taler på en neutral måde først, i passiv stemme, som ikke påvirker menneskelig kommunikation så meget. Robotten siger, på en meget Reagan-agtig måde, der blev lavet en fejl.

Men i den næste runde siger robotten, jeg lavede en fejl. Og du kan bare se, hvad der sker her. Lad os se, om vi kan få dette til at fungere. (25 sekunders pause) Så over mange, mange dusin runs, dette er den slags mønster, vi finder. Så en simpel manipulation, simpel manipulation i robotens talemønster ændrer, hvordan mennesker interagerer med hinanden. [00:30:25] Og det kræver ikke, jeg mener, det kræver ikke meget at forestille sig, hvordan hele den måde, vi designer vores chatbots og alt andet, måske påvirker ikke kun det Alexa-eksempel, jeg gav dig i starten, hvordan vi behandler hinanden. Menneskerne synes at stole mere på hinanden og have mere sjov i denne situation.

Nu er her stadig, og jeg tænker, at dette er det sidste eksperiment, jeg vil vise dig, hvorefter jeg vil afslutte. I et andet eksperiment udviklede vi en ny cyber-fysisk platform til at teste sådanne sociale og faktisk etiske effekter af simple typer af AI. På grund af arten af kollektive handlingsproblemer kan inddragelsen af AI i menneskelige grupper paradoksalt og utilsigtet undertrykke eksisterende gavnlige sociale normer hos mennesker, såsom dem der involverer samarbejde og altruism, som vi har udviklet som art. Så vi har hundrede tusinde års naturlig selektion, der arbejder på os for at gøre os i stand til at løse kollektive handlingsproblemer. Spørgsmålet er, hvis vi delegerer noget af den agentur til maskiner, vil vi så miste evnen til at arbejde sammen for at løse disse problemer? [00:31:32] Vil vi komme til at stole på disse maskiner, og derved degradere vores medfødte evne til at samarbejde og koordinere og skabe og så videre? I dette eksperiment, i samarbejde med Hiro Shirato fra CMU, en anden tidligere kandidatstuderende fra mig, byggede vi en platform, der involverede to små Raspberry Pi-udstyrede mekaniske køretøjer, og vi tilsluttede det til noget software, vi har, som gør det muligt for os at organisere online eksperimenter i stor skala. Så folk var i deres egne hjem, og de fik tildelt en af disse biler, og de kørte disse biler mod hinanden.

og vi havde dem til at spille kyllingespillet. Så i kylling, ved du, ligesom, hvem der når til den anden side hurtigst vinder. Så du bliver motiveret til ikke at vige for den anden. Men hvis I begge vælger ikke at vige, så støder I sammen, og I får begge det dårligste udbytte. Så hvad mennesker ville gøre i denne situation, hvis du spiller et itereret kyllingespil, er, at du hurtigt ville lære at tage skift. Denne gang er det din tur til at køre lige igennem, jeg trækker over og lader dig, men næste gang trækker du over og lader mig køre lige igennem. [00:32:35] Hvis vi er egoistiske, fortsætter vi bare med at styrte ind i hinanden, som at ødelægge hinanden gang på gang, eller dumt, vi svinger begge af, og ingen får fordelen ved at køre lige igennem. Så i denne situation her, beslutter den gule bil at trække over, den blå bil fortsætter bare uhindret hele vejen til den anden side.

Og vi brugte 300 deltagere og 150 dyader, og de blev betalt afhængigt af, hvor hurtigt de kom til den anden side. Og så tilføjede vi noget AI. Vi tilføjede automatisk bremsesupport, hvor når du havde en tæthedsadvarsel, når du kom nær den anden bil, bremste den og gav dig en chance for at beslutte, åh, jeg burde trække over og lade denne anden fyr komme forbi, eller omvendt. Eller vi tilføjede automatisk styringsassistance, som er, i det øjeblik det nærmede sig den anden bil, drejede det bare væk, okay? Og vi tilføjede en minimal kommunikationsfunktion, hvor folk kunne sige tak, eller noget i den retning. Bare meget minimal kommunikation. Og først viste vi, at automatisk bremsesupport, hvor bilerne stopper ved en fast afstand før kollisonen, øgede menneskelig altruisme. [00:33:38] Det vil sige, at give vej til andre, som den gule bil gør her. Så tilføjelsen af en lille automatisk bremsesupport AI gjorde det lettere for mennesker at arbejde sammen og samarbejde i situationen. Derudover hjælper det mennesker at kommunikere, hvilket yderligere hjælper dem med at lave gensidige indrømmelser i den automatiske bremsesituation. På den anden side, automatisk styringsassistance, hvor bilen simpelthen svarede, hæmmede fuldstændigt fremkomsten af gensidighed mellem folk til fordel for maksimisering af egeninteresse. Folk opgiver bare deres moralske agentur. De gider ikke længere. De lader bare maskinen gentagne gange dreje væk, og de giver op, okay? Så alle de medfødte etiske evner, som folk havde, er nu blevet fjernet ved tilføjelsen af AI i den automatiske styringsbetingelse, men forbedret i den automatiske bremsesituation. Og dette bør også få dig til at tænke. Du bør tænke, oh my god, hver lille detalje vi gør, når vi programmerer disse AI-agenter, kan have gode eller dårlige effekter på menneskers naturlige tilbøjeligheder.

Folkets evne til at samarbejde og tage ture samt handle altruistisk kan atrofere, hvilket fører til dårligere kollektive og individuelle resultater i sidste ende. [00:34:46] Og faktisk, kort sagt, kan AI føre til en slags moralsk dovenskab. (..) Her er et sidste eksempel på varig forandring efter eksponering for AI i hybride systemer. Og det er også et eksempel på, hvordan tilstedeværelsen af AI kan ændre menneskelige interaktioner, selv efter at AI ikke længere er en part i interaktionerne. Så i 2016 udviklede DeepMind AlphaGo, og i samme år spillede denne AI-agent mod Lee Sedol, den bemærkelsesværdige verdensmester fra Korea.

Jeg så kampen. Jeg kan ikke spille Go, men jeg genkender det som et storslået spil. Min søn spiller Go. (.) Og jeg heppede virkelig på Lee Sedol. Lee Sedol er som en helt i Korea, ligesom vi ville have, du ved, store idrætsfolk på vores Wheaties-kasser og sådan noget. Som, hans er på små nudelpakker og på morgenmadspakker. Jeg synes, det er fantastisk, at en klog nørd som mig i Korea bliver set som en vigtig person, okay? Så han er meget populær i Korea. Og han kommer ud til den første kamp, og han er for selvsikker. [00:35:47] Jeg kan se, at han er for selvsikker. Og han taber til maskinen, og så undskylder han over for sine fans. Han siger, jeg er så ked af det. Det er fem spil. Det er bedst ud af tre af fem, som vinder. Så spiller han et andet spil, og han taber igen. Og nu bliver han seriøs. Så spiller han et tredje spil, og han taber. Han har tabt konkurrencen.

Og man kunne på en måde se publikum, og kommentatorerne undrede sig over maskinens evne til at spille Go, hvilket gjorde disse mærkelige og smukke træk, hvoraf nogle senere blev opdaget at være træk, der er blevet spillet, fordi vi har optegnelser, der går tilbage tusinder af år med Go-kampe spillet i det kinesiske kejserlige hof. Og de kunne finde, åh, min Gud, dette er et middelalderligt træk, som maskinen lavede. Vi havde ikke set det i så lang tid.

Og så kommer Lisa Dahl tilbage i den fjerde kamp, og han vinder. (..) Og jeg græd. Jeg var så glad. (..) Fordi han havde maskinen, du ved, han var kommet tilbage for min art, og han havde slået den forbandede maskine. Ligesom, på en heroisk måde, jeg kunne ikke forstå, hvilken hjernekapacitet det må have krævet for Lisa Dahl at gøre det. [00:36:49] Jeg var ekstatisk på det tidspunkt og så stolt af ham for stadig at prøve, selv efter han havde tabt kampen.

Nu, hvad der er interessant, er, at da Lisa Dahl blev interviewet efterfølgende, sagde Lisa Dahl, at hans egen spilændring skete efter kampen. Så igen, AI hjælper mennesker med at hjælpe sig selv, okay? Han ændrer, hvordan han spiller på grund af kontakt. Og efterfølgende undersøgelser af andre videnskabsfolk så på professionelle Go-spillere og kiggede på den gennemsnitlige beslutningskvalitet. Der er nogle standarder i Go for at vurdere, hvor god en træk er, og median nytænking, som angiver, hvor usædvanlig et træk er. Og de finder ud af, at da AlphaGo besejrer den menneskelige verdensmester i 2016, begynder Go-spillere over hele verden at lave bedre træk, der er mere innovative, okay? Så alle menneskene, der spiller Go med hinanden, har ændret sig, fordi AlphaGo er blevet tilføjet. AI hjælper mennesker med at hjælpe sig selv. Så vi fortsætter med at bygge videre på vores arbejde for at designe og tilføje simple bots til disse og andre situationer involverende sociale dilemmaer og kollektive handlingsproblemer. [00:37:55] Vi ser på, hvordan bots kan påvirke koordinering, samarbejde, kommunikation, kreativitet, tillid, navigation, deling og evakuering. Og i vores laboratorium fokuserer vi ikke på super smart AI, som LLM'er eller AlphaGo, for at erstatte menneskelig kognition, men derimod på dum AI for at supplere menneskelig interaktion. Vi forsøger ikke at opfinde super smart AI for at erstatte menneskelig kognition. Vi opfinder dum AI for at supplere menneskelig interaktion. Og vores AI kan tillade at være dum, fordi menneskene er smarte. Vores AI er som platin, der tilsættes en organisk kemisk reaktion. Det er bare en katalysator. Alt hvad vi behøver, er katalysatoren til at hjælpe en gruppe mennesker til at blive bedre.

Og selvfølgelig er det vigtigt at anerkende, at det omvendte også er muligt. Social AI kan bruges til at skade grupper af mennesker. Men vores tilgang tilbyder en række andre tekniske og konceptuelle fordele. For det første er disse simple bots forståelige og viser derfor klart bredere kræfter og muligheder. I modsætning til LLM'er, som er en sort boks, og du ikke ved, hvad den laver, kan jeg fortælle dig præcist, hvad vores bot laver. [00:38:58] Det er støjende. Det faciliterer introduktioner. Det videresender beskeder på denne meget specifikke måde. Og for det andet kan vores kontrollerede bot-eksperimenter også give indsigt i, hvordan menneskelig adfærd også kunne ændre sig til gavn. Med andre ord kan jeg tage dette fra laboratoriet, og jeg kan lære en gruppe mennesker at gøre, hvad vores bots gjorde. På en måde kan du ikke nemt lære en gruppe mennesker bare at gøre, hvad ChachiPT gjorde her. Vi ved ikke, hvad ChachiPT laver, men du ved, hvad de laver i vores situation.

Så jeg vil gerne afslutte, dette er mit sidste slide, med en metafor. Overvej disse to objekter. De er begge lavet af kulstof. Hvis du tager kulstofatomerne og forbinder dem på én måde, får du grafit, som er blød og mørk. Tager du de samme kulstofatomer og forbinder dem på en anden måde, får du diamant, som er hård og klar. Og der er to centrale intellektuelle idéer her. For det første er disse egenskaber af blødhed og mørke samt hårdhed og klarhed ikke egenskaber ved kulstofatomerne. De er egenskaber ved samlingen af kulstofatomer. Og for det andet, hvilke egenskaber du får, afhænger af, hvordan du forbinder kulstofatomerne med hinanden. Tager du de samme kulstofatomer og forbinder dem på én måde, får du et sæt egenskaber. [00:40:01] Forbinder dem på en anden måde, får du et helt andet sæt egenskaber. Tilsvarende påvirker naturen af vores forbindelser egenskaberne af vores sociale grupper. Det er båndene mellem mennesker, der kan gøre helheden større end summen af dens dele. Nye egenskaber, såsom samarbejde og vold, innovation og produktivitet, tillid og mistillid, sandhed og falskhed, rigdom og fattigdom, sundhed og lykke, kan opstå og sprede sig på grund af forbindelserne, på grund af båndene mellem folk, og ikke nødvendigvis udelukkende på grund af folkene selv. Faktisk afhænger vores oplevelse af verden af strukturen og funktionen af de netværk, der omgiver os, tæt på og langt væk. Og vores art er udviklet til, at det skal være sådan. Og det bør ikke overraske os, at vi vil reagere på AI i vores midte. Tak skal I have.

Lignende indlæg