Nicholas Christakis – Konferens om samhällscentrerad AI

Nicholas Christakis: [00:00:05] Okej, så människor är inbäddade i sociala nätverk, och dessa nätverk följer mycket specifika matematiska, biologiska och sociala principer. Och i allt större utsträckning lägger vi till artificiell intelligens i form av online-agenter och fysiska robotar bland oss som interagerar med oss som om de vore sociala enheter. Och dessa typer av agenter som vi kommer att lägga till i våra system sträcker sig från självkörande bilar på vägarna till kassaapparater i butiker, till humanoida robotar i hem eller fabriker eller på slagfält eller i brandbekämpningssituationer, till disembodierade autonoma agenter såsom online-botar och digitala AI-assistenter i våra telefoner eller våra glasögon eller våra arbetsplatser. Och dessa teknologier interagerar med oss på en jämlik nivå, som om de vore människor. Och de kommer att ge upphov till hybrida system av människor och maskiner. Och dessa system erbjuder möjligheter för en ny typ av social artificiell intelligens.

Låt mig ge dig ett enkelt exempel på detta. När du får en digital assistent, som en Alexa, är tillverkaren av den enheten mycket bekymrad över interaktionen mellan människa och maskin. Och den interaktionen mellan människa och maskin optimeras. Till exempel skulle du aldrig köpa en Alexa om du varje gång du behövde något från den var tvungen att säga, ursäkta mig, Alexa, jag är mycket ledsen att jag avbryter dig. Om du inte har något emot det, skulle du vänligen kunna säga mig ordet? [00:01:35] vädret imorgon, eller hur? Det skulle betraktas som en absurd nivå av artighet. Du förväntar dig att kunna säga, Alexa, vädret, och sedan svarar maskinen lydigt. Och det är okej tills du tar in den maskinen i ditt hem och dina barn pratar med den maskinen och lär sig att vara ohyfsade. Och sedan går de till lekplatsen och är ohyfsade mot andra barn. Så den maskin som har lagts till i vår mitt, handlar inte bara om interaktionen mellan människa och maskin, det handlar om interaktionen mellan människa och människa i närvaro av maskiner. Och vad jag är intresserad av är inte, är det, utan människors interaktioner i närvaro av maskiner. Och vi kan använda en förståelse av social nätverksstruktur och funktion för att bedöma användningen och påverkan av social AI inom och på mänskliga grupper, i förhållande till faktorer som förtroende och samarbete som är nödvändiga för grupper av människor att arbeta tillsammans, och som påverkar beteendet hos dessa kollektiv.

Låt mig så att jag kan belysa en del av det arbete vi gör, eh, med flera tillvägagångssätt för nätverksexperiment som involverar, eh, artificiell intelligens. Dessa experiment utvärderar hur AI kan påverka strukturen och funktionen av mänskliga sociala interaktioner. [00:02:45] Nu finns det en klass av kollektiva handlingsproblem inom sociala interaktioner som vi har, som kallas koordineringsproblem. Det handlar om att dessa är problem som vi måste samarbeta för att skapa något som är användbart. Ibland löser vi dessa problem genom att skapa centraliserade institutioner, som polis eller domstolar eller regeringar. Men ofta kan vi lösa kollektiva handlingsproblem som kräver att vi koordinerar eller samarbetar med ett stort antal människor på ett decentraliserat sätt. Vi har faktiskt utvecklats för att ha denna kapacitet. Och en specifik typ av kollektiv handlingsproblem som jag skulle vilja börja med idag är faktiskt koordination.

Så, till exempel, för att undvika denna trafikstockning måste människor koordinera för att göra något olikt sina grannar. Så om alla lämnar sina hus samtidigt, så sitter alla fast i en trafikstockning. Men om de justerar sina avgångstider och lämnar över intervall, så är ingen fast i trafikstockningen. Naturligtvis kan ni ha någon form av central myndighet som koordinerar detta. Ni lämnar först, sedan ni, och sedan ni. [00:03:45] Men idealiskt sett skulle ni vilja ha någon form av decentraliserad, icke-topp-ned metod för att människor koordinerar för att lösa detta problem.

Så här var vårt första experiment som publicerades 2017 om sådana hybrida system som utforskade hur AI kan hjälpa till med en sådan utmaning. Vi utforskade prestationen hos mänskliga grupper som var engagerade i en koordineringsuppgift. Vårt paradigm var att låna från datavetenskap något som kallas för graffärgningsproblemet. Detta är ett klassiskt problem inom datavetenskap. Men vad vi gjorde var att vi tog det och placerade människor i den situationen. Så vad vi gjorde var att vi tog 4,000 personer och placerade dem i 230 online-grupper. Dessa människor släpptes in i dessa grupper. De blev slumpmässigt tilldelade en plats inom ett artificiellt nätverk som vi skapade, vars struktur ungefär liknade verkliga mänskliga nätverk. De släpptes in i dessa platser och fick veta att de tilldelats en av tre färger, [00:04:46] en lila, orange, lila, orange och rosa. Och de fick veta att de var tvungna att välja en färg som var olik sina grannars.

Och de fick fem minuter på sig att göra det. Så dessa människor skulle titta runt på sina grannar. Varje person skulle titta runt och säga, som, den här killen här är rosa. Han ser att han har en rosa granne och en orange granne. Vad han borde göra är att byta till lila färg. Och de röda linjerna här indikerar färgkonflikter. Med andra ord, om de två färgerna hos angränsande noder är desamma, får de en röd linje. Och de bakgrundslila linjerna indikerar strukturen av sociala interaktioner. Så du sätter in människorna här. De tittar runt på sina grannar varje sekund eller sekunden och en halv. De gör ett byte som är i linje med målet att alla av dem måste välja en färg som är olik sina grannar under de kommande fem minuterna. Och om de gör det, då och endast då kommer de att få betalt. Jag kommer att betala er för att samarbeta. Och om ni alla arbetar tillsammans på ett decentraliserat sätt för att lösa problemet, får ni alla betalt. Annars får ni inget, okej? Så här är vad som händer i det här experimente. Här på x-axeln är tid i sekunder upp till femminutersmärket. [00:05:47] Spelet varar i fem minuter där nere någonstans. Och här på y-axeln är målfunktionen eller antalet färgkonflikter. Och så här i början finns det 12 färgkonflikter. De tilldelas slumpmässigt sina initiala färger. Och det visas här på den här lilla histogrammet där. Så människorna börjar titta runt och byta sina färger. Du vet, de byter och de byter. Och de når den punkten här där de nu har nått en situation där det finns en färgkonflikt mellan dessa två personer. Och denna konflikt, dock, är vad vi kallar en icke-lösbar konflikt. Så de ljusorange linjerna är lösbara konflikter. Det är den här killen här. Han kan göra en flytt till lila som löser konflikten. Men de här killarna här som är orange, det finns ingen flytt de kan göra som minskar antalet färgkonflikter i deras grannskap, eller hur? Den här killen kan inte byta till lila för att, faktiskt, om han byter till lila, kommer han att få fler konflikter. Han har liksom fyra lila grannar. Och han kan inte byta till rosa för att han har två rosa grannar. Så han tittar och säger, tja, den minsta konflikten jag har är att bara stanna orange. Så nu är den här gruppen fast, eller hur? [00:06:49] De har en icke-lösbar konflikt och ingenting kan hända. Inga framsteg kan göras i lösningen av det kollektiva handlingsproblemet förrän en av dessa två personer gör ett motintuitivt drag, byter färg till lila eller rosa, och temporärt ökar konflikterna. Och det är faktisk det som händer. Och sedan går tiden, och människorna vid 245 sekunder löser problemet. Maskinen upptäcker lösningen, stoppar spelet och betalar dem, okej?

Nu, eftersom vi var listiga, så gjorde vi några experiment där vi smygbytte ut några av människorna mot bots. Och vi utvärderade hur tillägget av AI-försedda bots för att skapa ett hybrid system påverkade gruppens prestation. Är det möjligt att lägga till några bots i mänskliga grupper och förbättra deras förmåga att koordinera när de står inför en sådan utmaning? Och vad vi gjorde var att vi lade till tre bots, och vi varierade experimentellt två axlar. Var botsen placerades, där de slumpmässigt släpptes in i nätverket, där de placerades i [00:07:51] nätverkets centrum, eller där de placerades i nätverkets periferi. Och vi manipulerade slumpmässigt deras typ av AI-kapacitet här på ett mycket trivialt och enkelt sätt. Nämligen, vi manipulerade huruvida botsen agerade med perfektion eller agerade med lite noise.

I perfektion-situationen, tittade botsen varje och en halv sekund runt på sina grannar, och så valde de den färg som hade minst konflikt med sina grannar. Vad du kanske skulle tänka på som irrationellt beteende. I 10% noise-situationen gjorde de så, men 10% av tiden valde de en slumpmässig färg. Och i 30% noise-situationen gjorde de så, men 30% av tiden valde de en slumpmässig färg. Så vi gjorde botsen, låt oss säga, mer och mer felbenägna, mer och mer stökiga.

Och sen tittade vi på, vi hade, jag tror, något som liknade, låt oss börja med en kontrollgrupp. Vi plottade här på x-axeln tid, och dessa är överlevnadskurvor. På y-axeln är sannolikheten att gruppen som helhet inte har löst koordinationsspelet. Så här, om du tittar här, till exempel, i början, vid tidpunkt noll, [00:08:51] 100% av de enda mänskliga grupperna, sessionerna med endast människor, är i orange. I början har 100% av de endast mänskliga grupperna inte löst spelet. Och sen när tiden går, så löser fler och fler av de mänskliga grupperna spelet, så att vid slutet av de fem minuterna, kanske 60% av de endast mänskliga grupperna har löst spelet.

Vad som händer är att om du sätter 10 % störande bots i det centrala läget av nätverket, får du märkbart förbättrad prestanda. Här löste betydligt fler grupper av människor problemet när bots med lite störningar lades till i mitten. Faktum är att de minskade den genomsnittliga lösningstiden från 232 sekunder till 103 sekunder. Det finns också andra fynd i dessa data. Perfekta bots och överdrivet störande bots var båda inte till hjälp. Du behövde lite kalibrering. Det var de 10 % störande bots som var mest hjälpsamma. Och också positionen av bots hade viss påverkan. Men avgörande i dessa experiment fann vi också att människor som inte var kopplade till bots, [00:09:52] som var längre bort i nätverket. Så i graferna fanns det vissa människor som var kopplade till bots och andra som inte var det. Vi fann att även dessa människor började ändra sättet de spelade på. Så det fanns en ripple-effekt, en kaskadeffekt. Fördelarna med hur bots interagerade med sina människor spred sig genom nätverket och började påverka människa-människa-interaktioner längre och längre bort i nätverket. Med andra ord, bots hjälpte människorna att hjälpa sig själva, och fördelarna med störningarna spreds inom detta sociala system.

Låt mig nu ytterligare förtydliga idéer angående denna kollektiva utmaning och hur dessa enkla AI-agenter kan hjälpa med en annan analogi. Så föreställ dig att du har ett plan. Det här är som i gradientnedstigning inom maskininlärning, till exempel. Så du har ett plan, och du har kullar och ett berg. Och du har olika kullar, okej, av olika höjd. Och du har ett berg långt här uppe som är det högsta berget. Så jag släpper, jag tänker ta fyra av er, och jag klipper ihop er här någonstans, och jag kommer att sätta handklovar på er, varje av er med blicken riktad i en annan kardinal riktning, [00:10:54] och jag kommer att sätta en ögonbindel på er. Och jag kommer att säga till er, hitta det högsta berget. Så ni pratar med varandra och säger, väl, varför tar vi inte ett steg i vår riktning och rapporterar tillbaka till teamet? Så ni tar ett steg norrut, och ni säger att det är uppför härifrån. Och söder säger att det är nedför härifrån. Och öst och väst säger att det är lateralt härifrån. Så ni alla enas om att ta ett steg norrut. Och ni fortsätter att göra detta iterativt tills ni når en punkt då alla säger att det är nedför härifrån.

Har ni hittat det högsta berget? Nej. (...) Vad har ni gjort? Ni har hittat den närmaste kullen.

Kommer du någonsin att hitta det högsta berget? Nej. Du kommer aldrig att hitta det högsta berget. Du är fast. Du är lokalt optimerad, men globalt underoptimerad. Och för att globalt optimera, behöver du lite brus. Du behöver ibland tillåta denna grupp människor att ta ett motintuitivt steg ner för berget eller ner för kullen. Så de tar ibland av en slump en sekvens av steg tills de kommer tillbaka till planet. Och sedan navigerar de runt i detta hälsolandskap, utforskar alla dessa toppar tills de hamnar på denna topp. [00:11:56] Och denna höga topp tenderar, det globala optimum, tenderar att vara ett mottagande tillstånd eftersom det tar mycket mer brus för att komma bort från den toppen än de andra topparna. Och så nu oscillerar du runt det globala optimum. Så i vårt arbete har vi utforskat denna slags enkla programmering insatt i sociala system för att se om vi kan förbättra människors prestationer när det gäller att hantera olika typer av kollektiva handlingsproblem.

Nu involverar ett annat kollektivt handlingsproblem en annan utmaning, som är samarbete, inte koordinering. Människor måste ofta samarbeta för att producera det som kallas en offentlig nyttighet. Och ett fyrtorn är ett av de klassiska exemplen på en offentlig nyttighet. Offentliga nyttigheter har två kännetecknande egenskaper. För det första, det som kallas icke-exkluderande. Och det betyder att andra personer inte kan förhindras från att använda det. Om du bygger ett fyrtorn för din egen personliga nytta, för att du navigerar på haven och inte vill krascha in i kusten, är det bra för dig, men du kan inte stoppa andra från att använda det, okej? Icke-exkluderande. [00:12:58] Och dessutom är det icke-rivaliserande. Det betyder att konsumtion av en person inte minskar konsumtionen av andra. Om jag använder ljuset från mitt fyrtorn, finns det inget mindre ljus för dig att använda. Och detta är oavsett, till exempel, en bit tårta. Om jag har en bit tårta, är den min, eller hur? Jag kan förhindra dig från att äta den. Och om jag äter den, finns det ingen kvar för dig, okej? Så offentliga nyttigheter har dessa egenskaper, och det är dessa egenskaper som i sin tur gör det mycket svårt att producera offentliga nyttigheter. För när det handlar om att bygga ett fyrtorn, är det mycket frestande att sätta dina individuella intressen mot gruppens. Om du inte bidrar till att bygga fyrtornet kan du fortfarande dra nytta av det. Och så är alla frestande att göra inget, och då blir inte fyrtornet byggt till allas nackdel. Och det är också värt att betona att offentliga nyttigheter är användbara, eftersom du faktiskt kan producera saker med dem, såsom säker sjöfart. Och som sådant är underinvestering i offentliga nyttigheter ett allvarligt problem i vårt samhälle, och har också kommit att kallas tragedin i det gemensamma. Dessa offentliga nyttigheter, till exempel, normer av förtroende som vi upprätthåller bland oss, är effektiva. [00:14:01] Tänk på när du var i gymnasiet. Vissa av er gick på ett gymnasium där eleverna litade på varandra, och det betydde att ni kunde lämna era ryggsäckar ensamma i korridoren utan att oroa er för att någon skulle stjäla dem. Andra av er gick på gymnasier där det inte fanns samma normer för förtroende, och nu skulle ni behöva låsa in er ryggsäck eller ha den med er hela tiden. I vilken av dessa två miljöer tror ni att ni skulle ha fått bättre lärande? Höger? I den tidigare miljön. Så den norm som kollektivt upprätthålls är produktiv. I det fallet, produktiv för lärande. Här, produktiv för säker sjöfart och så vidare.

Så samarbete i mänskliga grupper för att producera offentliga varor är utmanande, och olika mekanismer krävs för att upprätthålla det. Vi har genomfört många experiment som involverar att sätta människor i nätverksgrupper och be dem spela olika typer av spel för offentliga varor med sina grannar, och manipulera många strukturella och andra egenskaper genom åren. Så, till exempel, började vi för flera år sedan med ett experiment där människor sattes in i ett nätverk som detta. De introducerades för sina grannar och de spelade ett spel för offentliga varor från, liksom, beteendeekonomi, [00:15:03] där, liksom, jag kunde ge en liten summa pengar till var och en av mina grannar. Jag tar en dollar och delar den bland mina grannar. Och sedan dubblar forskarna dollarn. Så låt oss säga att jag har fyra grannar. Låt oss säga att jag har tre grannar och jag ger en dollar till gruppen. Det blir två dollar. De två dollarna delas bland oss fyra. Så hela gruppen ökar sin rikedom med två dollar, men jag får bara tillbaka 50 cent. De två delat med fyra, jag får tillbaka 50 cent. Så jag måste göra ett offer för andras nytta. Så naturligtvis säger alla, jag vill inte offra. Låt alla andra dumskallar ge pengar. Jag kommer inte att ge något, och förhoppningsvis kommer andra att bidra. Men, naturligtvis, om alla gör det, får man ett sammanbrott igen. Och det bästa beteendet är om alla bidrar maximalt. Så här i denna situation börjar vi spelet. De blå prickarna är, de blå människorna är de snälla samarbetsvilliga människorna. De ger maximalt till sina grannar, och de skapar offentlig service, som att bygga fyrtornet. De röda prickarna är exploatörerna som inte gör några bidrag, vad som också kallas defektorer. Och vad vi hittar i detta experiment är att vi reproducera ett resultat som har varit känt i 30 år, [00:16:03] vilket är att samarbetet kollapsar i grupper, rätt? I slutet av spelet, flera rundor senare, blir nästan alla defektorer, förutom dessa små blå personer här på sidan, som håller civilisationen vid liv, vet ni, bland sig själva. Du kan också tänka på, igen, för att åberopa gymnasiet för studenterna. Kommer ni ihåg den situationen där er lärare i vetenskap tilldelade er fyra att göra ett grupprojekt, och ni skulle få samma betyg? Och ni tilldelades fyra, tre andra förlorare. Så nu har ni två val. Antingen gör du allt arbete, och de får också A:n för att du vill ha ett A. Eller så säger du, det är löjligt. Jag vill inte att dessa lata killar ska dra nytta av mitt hårda arbete. Och du säger, jag kommer inte att göra någonting heller, och ni får alla F:n, eller hur? Det är ett fruktansvärt dilemma. Vad som händer här är att människor till slut väljer det senare alternativet. De väljer alla att få F:n för att de inte vill vara dumskallar och fortsätta bidra. Så samarbetet kollapsar i sociala system som ett allmänt resultat. Men vad vi gjorde är att vi återigen lade till några, om än olika typer av bots till systemet. Vi la till några bots som var försedda med mycket enkel A. [00:17:05] Och dessa bots var som små äktenskapsmäklare. De medlade sociala interaktioner. De såg sig omkring lokalt på vem som interagerade med vem, och de gav förslag till människorna i systemet. Vet ni vad? Ni borde klippa banden med den där defektorn som utnyttjar er och forma ett band med den här trevliga killen istället. Och detta milda omkopplingsråd som endast använder lokal kunskap. Det finns ingen lärare där som befaller folk att vara snälla. Ingen polis. Ingen domstol. Ingen central myndighet som verkställer detta. Bara agera på lokal kunskap, fann vi att dessa bots skulle, i våra experiment med över 1 000 människor i 64 grupper, vi fann att inte bara kunde samarbetet stabiliseras, utan för första gången någonsin visade vi ett resultat som samarbetet faktiskt kunde öka från baslinjen när dessa typer av bots lades till. Och DeepMind återskapade sedan våra resultat och utökade dem i ett annat pappersarbete som publicerades för ungefär ett år eller så eller två efter detta.

I ett annat experiment utforskade vi hur bots kan påverka gruppens kreativitet. [00:18:07] eftersom det är svårt att hitta nya idéer. Teori och experiment tyder på att grupper kan vara bättre på att identifiera och bevara innovationer än individer genom att dela sina upptäckter.

Men innovation inom grupper möter sina egna utmaningar, inklusive groupthink. Rätt? Om du samlar en grupp människor kan de prematurt enas om en suboptimal idé.

Eller så kan du föreställa dig, du bör föreställa dig, att en grupp människor kanske kollektivt har större visdom, kanske kan komma på fler idéer. Till exempel, om du ger en grupp människor uppgiften att förbättra ett fiskespö, vet du, den första personen kanske säger, varför sätter vi inte en krok i änden av en snöre? Och sedan står personen med snöret med en krok. Och någon säger, varför sätter vi inte en pinne på snöret? Åh, det är en bra idé. Så de kombinerar sin kunskap och gör det. Och någon säger, tja, betet med kroken flyter på ytan. Låt oss lägga till en våg så att det går ner. Tja, nu går det för långt ner. Hur en bobber så att vi vet var det är och så vidare. Och så innoverar folk, delar kunskap med varandra, bevarar kunskap över tid, [00:19:08] och du får dessa kulturella artefakter som är den sammansatta produkten av flera personer som delar idéer och är kreativa.

Så vi ville skapa ett spel där grupper av människor letade efter en optimal idé i ett landskap. Och vi beslutade att använda substantiv som en proxy för idéer. Vi tog 20 000 substantiv från den klassiska datavetenskapliga word-to-vec-korpusen. Så vi tog 20 000 substantiv. Och avståndet mellan dessa substantiv kunde definieras av cosinuslikhetsmetoden. Du kan föreställa dig ett hyperdimensionellt vektorrum där katt är mer lik hund än skrivbord. Och sättet de gjorde detta på var att de såg på hur ofta orden katt och hund förekom tillsammans på webbplatser. Så de hade ett universum av webbplatser och ett universum av 20 000 substantiv. Och de sa att dessa två substantiv ofta förekommer tillsammans och dessa två andra substantiv förekommer inte ofta tillsammans. De skapade ett 300-dimensionellt vektorrum. [00:20:08] Och nu kan du beskriva hur lika två substantiv är. Och vi beslutade att använda substantiv som en proxy för idéer. Vi tog dessa 20 000 substantiv. Och sedan valde vi en uppsättning substantiv. Tänk dig att vi valde ett substantiv, men vi valde en uppsättning. Ett substantiv av en slump från alla dessa, som braggadocio till exempel, var ett substantiv. Så vi valde braggadocio. Och vi säger att det är den perfekta idén som vi vill att denna grupp människor ska hitta. Och sedan faller alla substantiv som ligger nära braggadocio bort i detta vektorrum. Så du har det topp-substantivet som får flest poäng, 20 000 poäng, och alla andra substantiv till de substantiv som är längst bort. Och vi satte mänskliga varelser i detta system och vi säger, hitta detta ord. Vi säger inte ordet. Och sedan berättar vi poängvärdet av orden. Så de börjar gissa. Och när de gissar får de feedback. Och de säger, åh, detta ord har fler poäng än ett annat ord. Och de kommer närmare och närmare och börjar dela kunskapen med varandra. De försöker vara kreativa för att lösa problemet.

Så varje substantiv är relaterat till andra i ett semantiskt rum eller ett ändlöst landskap. [00:21:10] Vi hade 18 olika målsubstantiv, som om vi dragit upp en topp från landskapet av dessa 20 000 substantiv på 18 olika platser i 18 olika landskap. Och dessa substantiv var avsiktligt ovanliga, som fratricide, shoehorn, sarcoma, kartografi, och så vidare. Och sedan utförde vi experiment som involverade flera förhållanden där människor var ensamma och försökte navigera i landskapet, där människor var i grupper som arbetade tillsammans för att navigera i landskapet, eller där människor var i grupper men också hade några bots där inne som försökte hjälpa dem att vara kreativa. Och bots fungerade eftersom de kunde överföra information från en region av nätverket till en annan genom att kommunicera med varandra. Så till exempel kunde bot nummer två skicka ordet himmel eller bil till bot nummer ett. Så här är ett nätverksexempel.

Vi släpper in folk. De fyrkantiga prickarna är bots. Och denna bot har fyra interaktioner, och denna bot har, jag vet inte, sex eller sju interaktioner. Människorna börjar gissa. [00:22:12] De har inte någon grund för en gissning alls i första rundan av spelet. De gissar på himmel, bil, kanin, råtta, hund, katt, skrivbord. Om jag skulle fråga er, välj ett substantiv att gissa, skulle ni gissa hus eller sol eller måne eller katt eller hund eller något litet typiskt substantiv. Och nu får de veta poängvärdet, hur lik är ordet råtta, hund, katt, skrivbord, och så vidare, i förhållande till sarcoma. Och de får veta poängvärdena för dessa substantiv i relation till det målsubstantiv som är sarcoma. Och sedan tillkännages dessa poängvärden för dem. Och sedan kan denna bot titta på poängvärdena för människorna runt omkring och kan vidarebefordra antingen ett slumpmässigt val till denna bot eller det högsta poängvärdet eller det lägsta poängvärdet, som en slags bakdörrskanal för kommunikation som sprider information från en region av en grupp människor som försöker lösa problemet till en annan region. Så låt oss titta på några exempel för att åtgärda detta, för detta kan vara svårt att förstå. Människorna spelade detta spel i ungefär 25 rundor. Och här är kosinlikheten med ett målsubstantiv, som är ordet fratricide. Okej, så det finns 20 000 substantiv. [00:23:13] Fratricide är 20 000 poäng. Och de andra orden har andra poäng. Och här är en ensam person, en person på egen hand som gissar. Så deras första gissning är bit. Och de får veta hur likt ordet bit är fratricide. Och sedan är deras nästa gissning födelse. Och de får ett stort hopp i kosinlikhet, för man kan tänka sig att ordet födelse är närmare ordet fratricide än ordet bit. Okej? Och sedan gissar de. De försöker pengar nästa. Det är sämre. Sedan försöker de apa. Det är ännu sämre. De kollar. De gör en verklighetskontroll. De försöker födelse. Det hoppar upp igen. Sedan försöker de baby. Det är inte en dålig gissning. Födelse till baby. Men baby tar dem längre bort från fratricide. Och sedan dam och så vidare. Och de navigerar. Och de gissar. Och de gissar. Och de gissar. Och de kommer ingenstans nära fratricide i slutet. Nu i denna andra situation har vi en grupp människor, men inga bots. Och nu kan människorna, utöver att göra sina egna gissningar, se gissningarna från människorna runt omkring dem. Och bygga vidare på andras idéer. Okej? Skapat. Som att göra fiske­spöt tillsammans. [00:24:13] Så denna person, deras första gissning är hund. Men deras nästa gissning är sköld. Du kan se att sköld är närmare fratricide än hund. Och denna person gissar och gissar och får input från sina grannar. Och i slutet kommer han närmare och närmare. Han hamnar med ordet fiende. Okej? Egentligen var soldat hans bästa gissning. Hade det högsta poängvärdet under hans bana.

Så hur påverkade det att lägga till botarna? Så detta visar återigen sammanfattningen av resultaten. På x-axeln är omgången. På y-axeln är den genomsnittliga kosinuslikheten i detta hyperdimensionella vektorrum, vilket är ett mått på gruppens prestation. Och här är en grupp människor som agerar, gissar ensamma. Så människorna som gissar på egen hand gör inte så bra ifrån sig, eller hur? Det är bara chans huruvida de kan på något sätt, eller, ja, någon inneboende förmåga i varje individuell människa. De blir lite bättre med tiden och kommer närmare. Alla grupper presterar bättre än de som är ensamma. Och detta är ett gammalt resultat som är känt. En grupp människor är mer kreativ än en annars liknande uppsättning av solopraktiker. Men vad vi upptäcker är att om vi lägger till den mest liknande boten, boten som tittade på sina grannar, [00:25:17] och fann, vad är deras lokala konsensus här? Mina människor verkar tycka att detta är ett bra ord. Och sedan vidarebefordrar det till boten i en avlägsen del av nätverket. Den boten förbättrade avsevärt prestationen hos denna grupp människor för att göra en upptäckte. Du bör kunna föreställa dig hur detta kan fungera i en grupp av ingenjörer eller andra kunskapsarbetare. Hur, liksom, du kan distribuera kunskap på ett effektivt sätt, undvika grupptryck och främja kreativitet, genom att utforma botar som hjälper människorna att hjälpa sig själva. Boten här har ingen hjärna. Den föreslår inte själv idéer. Den hjälper bara människorna att sprida idéerna mellan sig själva.

Så enkla AI-agenter med tolkningsbar beteende kan öka kapaciteten för kreativ upptäckte i mänskliga grupper genom att dela idéer runt vilka det finns lokal konsensus i en del av gruppen med människor i en avlägsen del av gruppen. Och som ett resultat kan gruppen prestera bättre.

Nu har vi även börjat experimentera med fysiska system. Och vi har lagt till humanoida och icke-humanoida robotar [00:26:19] utrustade med enkel AI för att hjälpa grupper av människor att samarbeta ansikte mot ansikte och visat hur de kan underlätta samarbetet genom att hjälpa dem att övervinna friktion eller oförmåga att samverka i sina interaktioner. Ett av mina favorit exempel på detta är ett experiment jag gjorde med min tidigare doktorand, Maggie Traeger, som sitter i bakgrunden och nu är biträdande professor vid Notre Dame, är detta experiment. I det här experimentet tog vi tre riktiga människor som kom in i laboratoriet och en humanoid robot. Vi designade ett litet spel, ett litet spårspel, som spelades på en surfplatta, och denna grupp av människor och en robot hade uppgiften att lägga spår från punkt A till punkt B, som små Thomas the Tank Engine spår. Sedan gav vi dem några bitar som de kunde välja från på surfplattan, som raka bitar och böjda bitar. Men vi konstruerade ibland, även om det såg ut som om det fanns en blandning av bitar och att de i princip borde kunna gå från punkt A till punkt B, vi designade det listigt så att det inte fanns rätt antal kurvor för att de skulle kunna ta sig från punkt A till punkt B. [00:27:21] Så de kunde inte göra det. De kunde inte lösa problemet utan att veta om det. Okej? Så först skulle varje person turas om att lägga en bit spår, sedan nästa person och nästa person. De arbetar tillsammans för att koppla ihop punkt A med punkt B på sina surfplattor.

Och vad vi gjorde i det här experimentet var att vi manipulerade, och de spelade 30 rundor av detta spel i denna virtuella värld, och vi hade 51 grupper, vi manipulerade robotsamtalsstilen, specifikt huruvida roboten uttryckte sårbarhet genom att erkänna ett misstag. Så roboten sa, du vet, jag gjorde ett misstag. Eller huruvida roboten berättade pappaskämt. Jag antar att alla vet vad pappaskämt är. Okej. Så vi lät också roboten berätta, förresten, det här är ett kulturellt universellt fenomen, som antropologer i Amazonas djungel har tittat på när de studerade urfolk, och papporna där berättar också pappaskämt. Och barnen är som, jag kan inte tro att pappas dumma skämt. Men hur som helst, och faktiskt finns det en teori om vad pappaskämt ska göra för att härda upp barnen på ett sätt. Detta är en teori. Men hur som helst, det är en helt annan tangent. Hur som helst, vi lät våra robotar berätta pappaskämt eller uttrycka sårbarhet. [00:28:21] Och vad vi var intresserade av att ta reda på var om förändringar i robotspråk hade makten att inte bara påverka hur människor interagerar med robotar, utan också hur människorna interagerar med varandra. Och återigen erbjuder detta möjligheten att modifiera sociala interaktioner genom introduktionen av artificiella agenter i hybrida system av människor och maskiner.

Så här är ett litet exempel på, åh, och jag berättade inte resultaten för er. Så här är, här är när vi har, så dessa, tjockleken på dessa linjer, vi ställer in videokameror för att övervaka vem som pratar med vem och hur mycket de pratar. Och tjockleken på dessa linjer indikerar hur mycket person två pratar med person ett och så vidare. Så person ett pratar inte så mycket med roboten. Det är en tunn linje. Och när ni hade neutrala robotar, får ni detta mönster. Men när ni hade den sårbara roboten, blir alla dessa linjer tjockare och de jämnas ut. Så vi fann att en sårbar robot ökade jämlikheten i talet bland människorna, ökade volymen av talet bland människorna, och faktiskt, i separata resultat, [00:29:22] ökade människornas tillfredsställelse i den typen av miljö.

Och här är bara ett klipp från två olika rundor som illustrerar att roboten pratar på ett neutralt sätt först, i passiv röst, vilket inte påverkar den mänskliga kommunikationen så mycket. Roboten säger, på ett mycket Reagan-likt sätt, ett misstag begicks.

Men i nästa runda säger roboten, jag gjorde ett misstag. Och ni kan bara se vad som händer här. Låt oss se om vi kan få detta att fungera. (25 sekunders paus) Så över många, många dussin försök är detta det mönster vi ser. Så en enkel manipulation, enkel manipulation i robotens talmönster ändrar hur människorna interagerar med varandra. [00:30:25] Och det kräver, antar jag, inte mycket för att föreställa sig hur hela sättet vi designar våra chattbotar och allt annat kan påverka hur vi behandlar varandra. Människorna tycks lita mer på varandra och ha roligare i denna situation.

Nu är här stilla, och jag tror att detta är det sista experiment jag ska visa dig och sedan kommer jag att avsluta, i ännu ett experiment utvecklade vi en ny cyber-fysisk plattform för att testa sådana sociala och faktiskt etiska effekter av enkla typer av AI. Eftersom med tanke på naturen av kollektiva handlingsproblem, kan involveringen av AI i mänskliga grupper paradoxalt och oavsiktligt undertrycka befintliga fördelaktiga sociala normer hos människor, såsom de som involverar samarbete och altruism som vi har utvecklat som art att ha. Så vi har hundratusentals år av naturlig selektion som verkar på oss för att göra oss kapabla att lösa kollektiva handlingsproblem. Så frågan är, om vi delegerar något av det handlingsutrymmet till maskiner, kommer vi då att förlora förmågan att arbeta tillsammans för att lösa dessa problem? [00:31:32] Kommer vi att börja förlita oss på dessa maskiner, och så försvagar vi vår medfödda förmåga att samarbeta och samordna och skapa och så vidare? Så i detta experiment, i samarbete med Hiro Shirato på CMU, en annan tidigare doktorand till mig, byggde vi en plattform som involverade två små Raspberry Pi-försedda mekaniska fordon, och vi kopplade det till någon programvara som vi har som gör att vi kan organisera online-experiment i stor skala. Så människor var i sina egna hem, och de blev tilldelade en av dessa bilar, och de körde dessa bilar mot varandra.

och vi lät dem spela kycklingspelet. Så i kyckling, vet du, som, den som kommer över till andra sidan snabbast vinner. Så du är incitamenterad att inte ge efter för den andra. Men om ni båda väljer att inte ge efter, då krockar ni, och ni får båda det sämsta utfallet. Så vad människor skulle göra i denna situation, om ni spelar ett upprepat kycklingspel, är att ni snabbt skulle lära er att turas om. Denna gång är det din tur att köra rakt igenom, jag drar över och låter dig vänta, men nästa gång drar du över och låter mig köra rakt igenom. [00:32:35] Om vi är egoistiska, kör vi bara in i varandra, som att förstöra varandra gång efter gång efter gång, eller dumt, svänger vi båda av, och ingen får fördelen av att köra rakt. Så i denna situation här, beslutade den gula bilen att köra åt sidan, den blå bilen fortsätter obehindrat hela vägen till andra sidan.

Och vi använde 300 deltagare och 150 par, och de fick betalt beroende på hur snabbt de kom till andra sidan. Och sedan lade vi till lite AI. Vi lade till automatisk bromshjälp, där när du hade en avståndsvarning, när du kom nära den andra bilen, så bromsade den och gav dig en chans att bestämma, oj, jag borde köra åt sidan och släppa fram den här killen, eller tvärtom. Eller så lade vi till automatisk styrhjälp, vilket är, i det ögonblick det kom nära den andra bilen, svängde den bara av, okej? Och vi lade till en minimal kommunikationsfunktion, där folk kunde säga tack, eller något liknande. Bara väldigt minimal kommunikation. Och först visade vi att automatisk bromshjälp, där bilarna stannar på ett fast avstånd innan de kolliderar, ökade människors altruism. [00:33:38] Det vill säga, ge väg för andra, som den gula bilen gör här. Så genom att lägga till lite automatisk bromshjälp AI gjorde det lättare för människor att samarbeta och samverka i situationen. Dessutom hjälper det att tillåta människor att kommunicera ytterligare dem att göra ömsesidiga eftergifter i den automatiska bromssituationen. Å andra sidan, automatisk styrhjälp, där bilen helt enkelt svängde, hindrade den helt uppkomsten av ömsesidighet mellan människor till förmån för maximering av egenintresse. Människorna överlämnar bara sin moraliska agentur. De bryr sig inte längre. De låter bara maskinen upprepade gånger svänga, och de ger upp, okej? Så alla inneboende etiska förmågor som människor hade har nu tagits bort genom tillägget av AI i den automatiska styrsituation, men förstärkts i den automatiska bromssituationen. Och detta bör också få dig att tänka efter. Du bör tänka, åh min gud, varje litet skröna vi gör när vi programmerar dessa AI-agenter kan ha goda eller dåliga effekter på människors naturliga tendenser.

Människors förmåga att samarbeta och turas om samt agera altruistiskt kan försvagas, vilket leder till sämre kollektiva och individuella resultat i slutändan. [00:34:46] Och faktiskt kan AI i korthet leda till en slags moralisk lathet. (..) Här är ett sista exempel på varaktig förändring efter exponering för AI i hybrida system. Och det är också ett exempel på hur närvaron av AI kan förändra människa-människa-interaktioner, även efter att AI inte längre är part i interaktionerna. Så 2016 utvecklade DeepMind AlphaGo, och under det året spelade denna AI-agent mot Lee Sedol, den anmärkningsvärda världsmästaren från Korea.

Jag såg matchen. Jag kan inte spela Go, men jag erkänner att det är ett magnifikt spel. Min son spelar Go. (.) Och jag hejade verkligen på Lee Sedol. Lee Sedol är som en hjälte i Korea, på samma sätt som vi skulle ha, du vet, stora idrottare på våra Wheaties-lådor och sånt. Som, hans bild finns på små nudelpaket och på flingpaket. Jag tycker att det är magnifikt att i Korea får en smart nörd som jag, du vet, ses som en viktig person, okej? Så han är väldigt populär i Korea. Och han kommer ut till den första matchen, och han är för självsäker. [00:35:47] Jag kan se att han är för självsäker. Och han förlorar mot maskinen, och sedan ber han sina fans om ursäkt. Han säger, jag är så ledsen. Det är fem matcher. Det är bäst av tre av fem som vinner. Sen spelar han en andra match, och han förlorar igen. Och nu blir han allvarlig. Sedan spelar han en tredje match, och han förlorar. Han har förlorat tävlingen.

Och man kunde se publiken, och kommentatorerna förundrades över maskinens förmåga att spela Go, göra dessa konstiga och vackra drag, varav några senare upptäcktes ha spelats eftersom vi har uppteckningar som går tillbaka tusentals år av Go-matcher spelade vid den kinesiska kejserliga domstolen. Och de kunde hitta, åh, min Gud, detta är ett medeltida drag som maskinen gjorde. Vi hade inte sett det på så länge.

Och då kommer Lisa Dahl tillbaka i det fjärde spelet, och han vinner. (..) Och jag grät. Jag var så glad. (..) För att han hade maskinen, du vet, han hade kommit tillbaka för min art, och han hade besegrat den förbaskade maskinen. Som, på ett heroiskt sätt, jag kunde inte förstå, som, den hjärnkraft som måste ha krävts för att Lisa Dahl skulle kunna göra det. [00:36:49] Jag var extatisk i det ögonblicket, och så stolt över honom för att han fortfarande försökte, även efter att han hade förlorat matchen.

Nu, vad som är intressant är att när Lisa Dahl blev intervjuad efteråt, sa Lisa Dahl att hans eget spel ändrades efter matchen. Så återigen hjälper AI människor att hjälpa sig själva, okej? Han ändrar hur han spelar på grund av kontakt. Och efterföljande undersökningar av andra forskare tittade på professionella Go-spelare och granskade den mediala beslutskvaliteten. Det finns en standard inom Go för att bedöma hur bra ett drag är, och medelvärdet av nyhet, som hur ovanligt ett drag är. Och de finner att när AlphaGo besegrar den mänskliga världsmästaren 2016, börjar Go-spelare världen över att göra bättre drag som är mer innovativa, okej? Så alla människor som spelar Go mot varandra har förändrats eftersom AlphaGo har lagts till. AI hjälper människorna att hjälpa sig själva. Så vi fortsätter att bygga vidare på vårt arbete för att utforma och lägga till enkla bots i dessa och andra situationer som involverar sociala dilemman och kollektiva handlingsproblem. [00:37:55] Vi tittar på hur bots kan påverka samordning, samarbete, kommunikation, kreativitet, förtroende, navigering, delning och evakuering. Och i vårt labb fokuserar vi inte på superintelligent AI, som LLM eller AlphaGo, för att ersätta mänsklig kognition, utan snarare på dum AI för att komplettera mänsklig interaktion. Vi försöker inte uppfinna superintelligent AI för att ersätta mänsklig kognition. Vi uppfinner dum AI för att komplettera mänsklig interaktion. Och vår AI kan tillåta att vara dum eftersom människorna är smarta. Vår AI är som platina som tillsätts i en organisk kemisk reaktion. Det är bara en katalysator. Allt vi behöver är katalysatorn för att hjälpa en grupp människor att bli bättre.

Och självklart är det viktigt att erkänna att det omvända också är möjligt. Social AI kan användas för att skada grupper av människor. Men vår strategi erbjuder flera andra tekniska och konceptuella fördelar. Först och främst är dessa enkla botar begripliga och illustrerar därmed tydligt bredare makter och möjligheter. Till skillnad från LLM:er, som är en svart låda och man inte vet vad den gör, kan jag berätta exakt vad vår bot gör. [00:38:58] Den är högljudd. Den fungerar som en mellanhand vid introduktioner. Den vidarebefordrar meddelanden på detta mycket specifika sätt. För det andra kan våra kontrollerade bot-experiment även ge insikter om hur mänskligt beteende på ett fördelaktigt sätt kan förändras. Med andra ord kan jag ta detta från laboratoriet och lära en grupp människor att göra vad våra botar gjorde. På ett sätt kan man inte enkelt lära en grupp människor att göra vad ChachiPT gjorde här. Vi vet inte vad ChachiPT gör, men du vet vad de gör i vår situation.

Så jag skulle vilja avsluta, detta är min sista bild, med en metafor. Tänk på dessa två objekt. De är båda gjorda av kol. Om du tar kolatomerna och kopplar dem på ett sätt får du grafit, som är mjukt och mörkt. Tar du samma kolatomer och kopplar dem på ett annat sätt får du diamant, som är hård och klar. Och här finns två centrala intellektuella idéer. För det första är dessa egenskaper av mjukhet och mörker samt hårdhet och klarhet inte egenskaper hos kolatomerna. De är egenskaper hos samlingen av kolatomer. För det andra beror vilka egenskaper du får på hur du kopplar kolatomerna till varandra. Tar du samma kolatomer och kopplar dem på ett sätt får du en uppsättning egenskaper. [00:40:01] Koppla dem på ett annat sätt får du ett helt annat set egenskaper. På liknande sätt påverkar naturen av våra kopplingar egenskaperna hos våra sociala grupper. Det är banden mellan människor som kan göra helheten större än summan av delarna. Nya egenskaper, såsom samarbete och våld, innovation och produktivitet, förtroende och misstro, sanning och osanning, rikedom och fattigdom, hälsa och lycka, kan uppstå och spridas på grund av kopplingarna, på grund av banden mellan människor, och inte nödvändigtvis enbart på grund av människorna själva. Faktum är att vår upplevelse av världen beror på strukturen och funktionen av nätverken runt oss nära och fjärran. Och vår art har utvecklats för att detta ska vara fallet. Och det bör inte överraska oss att vi kommer att reagera på AI i vår närhet. Tack så mycket.

Similar Posts