Nicholas Christakis – Conferência sobre IA Centrada na Sociedade

Nicholas Christakis: [00:00:05] Muito bem, então os seres humanos estão incorporados em redes sociais, e essas redes obedecem a princípios matemáticos, biológicos e sociais muito particulares. E, cada vez mais, estamos adicionando inteligência artificial na forma de agentes online e robôs físicos entre nós, que interagem connosco como se fossem entidades sociais. E esses tipos de agentes que vamos estar a adicionar aos nossos sistemas vão desde carros autónomos nas estradas a máquinas de checkout em lojas, a robôs humanoides em lares ou fábricas ou em campos de batalha ou em situações de combate a incêndios, até agentes autónomos desmaterializados, como bots online e assistentes digitais de IA nos nossos telefones ou nos nossos óculos ou nos nossos locais de trabalho. E estas tecnologias interagem connosco num campo de igualdade como se fossem humanos. E elas darão origem a sistemas híbridos de humanos e máquinas. E esses sistemas oferecem oportunidades para um novo tipo de inteligência artificial social.

Agora, deixe-me dar-lhe apenas um exemplo simples disto. Quando você recebe, por exemplo, um assistente digital, como uma Alexa, o fabricante desse dispositivo está muito preocupado com a interação humano-máquina. E essa interação humano-máquina é otimizada. Por exemplo, você nunca compraria a Alexa se toda vez que precisasse de algo dela, tivesse que dizer, desculpe, Alexa, lamento muito interrompê-la. Se você não se importar, poderia, por favor, dizer-me a palavra? [00:01:35] clima amanhã, certo? Isso seria considerado um nível absurdo de cortesia. Você espera poder dizer, Alexa, clima, e então a máquina responde obedientemente. E isso está bem até você trazer essa máquina para sua casa e seus filhos falarem com essa máquina e aprenderem a ser mal-educados. E então eles vão para o parque e são mal-educados com outras crianças. Assim, essa máquina que foi adicionada ao nosso meio, não se trata apenas da interação humano-máquina, mas da interação humano-humano na presença de máquinas. E o que me interessa não é apenas a interação humano-humano na presença de máquinas. E podemos usar a compreensão da estrutura e função das redes sociais para avaliar os usos e o impacto da IA social dentro e sobre grupos humanos, em relação a fatores como confiança e cooperação, que são necessários para que grupos de pessoas trabalhem juntos, e que afetam o comportamento dessas coletividades.

Então, deixe-me destacar um pouco do trabalho que estamos a fazer, utilizando várias abordagens para experiências de rede envolvendo inteligência artificial. Estas experiências avaliam como a IA pode afetar a estrutura e a função das interações sociais humanas. [00:02:45] Agora há uma classe de problemas de ação coletiva nas interações sociais que conhecemos como problemas de coordenação. Ou seja, estes são problemas em que temos de trabalhar juntos se quisermos criar algo útil. E às vezes resolvemos estes problemas criando instituições centralizadas como a polícia, os tribunais ou os governos. Mas muitas vezes conseguimos resolver problemas de ação coletiva que exigem que coordenemos ou cooperemos com grandes números de pessoas de uma forma descentralizada. Na verdade, evoluímos para ter esta capacidade. E um tipo específico de problema de ação coletiva com o qual gostaria de começar hoje é, de fato, a coordenação.

Então, por exemplo, para evitar este engarrafamento, as pessoas têm de coordenar-se para fazer algo diferente dos seus vizinhos. Portanto, se todos saírem de casa ao mesmo tempo, todos ficarão presos no engarrafamento. Mas se, se ajustarem os seus horários de saída e saírem em intervalos, então ninguém ficará no engarrafamento. Agora, claro, poderia haver algum tipo de autoridade central que coordenasse isto. Vocês saem primeiro, depois vocês, e depois vocês. [00:03:45] Mas idealmente, o que se desejaria é algum tipo de forma descentralizada, não de cima para baixo, de seres humanos coordenando-se para resolver este problema.

Então, aqui estava o nosso primeiro experimento que foi publicado em 2017 sobre sistemas híbridos que exploravam como a IA poderia ajudar com um desafio deste tipo. E explorámos o desempenho de grupos humanos que estavam envolvidos numa tarefa de coordenação. E o nosso paradigma foi pegar emprestado da ciência da computação algo conhecido como o problema da coloração de grafos. Este é um problema clássico na ciência da computação. Mas o que fizemos foi pegar isso e colocar seres humanos nessa situação. Então, o que fizemos foi reunir 4.000 pessoas e colocá-las em 230 grupos online. Esses seres humanos foram inseridos nesses grupos. E foram atribuídos aleatoriamente a um lugar dentro de uma rede artificial que criámos, cuja estrutura se assemelhava vagamente a redes humanas reais. E foram colocados nesses lugares e informados de que estavam atribuídos a uma das três cores, [00:04:46] um roxo, laranja, roxo, laranja e rosa. E foram instruídos a escolher uma cor diferente da dos seus vizinhos.

E eles tiveram cinco minutos para fazer isso. Assim, essas pessoas olhariam ao redor para os seus vizinhos. Cada pessoa olharia ao redor e diria, como, este cara aqui é rosa. Ele vê que tem um vizinho rosa e um vizinho laranja. O que ele deve fazer é mudar para a cor roxa. E as linhas vermelhas aqui indicam conflitos de cor. Em outras palavras, se as duas cores dos nós adjacentes forem as mesmas, eles recebem uma linha vermelha. E as linhas de fundo roxas indicam a estrutura das interações sociais. Portanto, você coloca as pessoas aqui. Elas olham ao redor para os seus vizinhos a cada segundo ou segundo e meio. Elas fazem uma mudança consistente com o objetivo de que todos devem escolher uma cor diferente dos seus vizinhos nos próximos cinco minutos. E se o fizerem, então, e só então, serão pagos. Eu vou pagar vocês para trabalharem juntos. E se todos trabalharem juntos de forma descentralizada para resolver o problema, todos serão pagos. Caso contrário, não recebem nada, certo? Portanto, aqui está o que acontece neste experimento. Aqui no eixo x está o tempo em segundos até o limite de cinco minutos. [00:05:47] O jogo dura cinco minutos, aqui em algum lugar. E aqui no eixo y está a função objetivo ou o número de conflitos de cor. E assim aqui no início, há 12 conflitos de cor. Eles são aleatoriamente atribuídos as suas cores iniciais. E isso é mostrado aqui neste pequeno histograma. E assim, as pessoas começam a olhar ao redor e mudar as suas cores. Você sabe, elas mudam e mudam. E elas chegam a este ponto onde agora alcançaram a situação em que há um conflito de cor entre essas duas pessoas. E esse conflito, no entanto, é o que chamamos de conflito irreconciliável. Assim, as linhas laranja claras são conflitos resolvíveis. Esse aqui, ele pode fazer uma movimentação para roxo que resolve o conflito. Mas esses caras que estão laranja, não há movimento que possam fazer que reduza o número de conflitos de cor no seu bairro, certo? Este cara não pode mudar para roxo porque, na verdade, se mudar para roxo, terá mais conflitos. Ele tem, tipo, quatro vizinhos roxos. E não pode mudar para rosa porque tem dois vizinhos rosas. Então, ele olha e diz, bem, o menor conflito que tenho é apenas ficar laranja. Portanto, agora esse grupo está preso, certo? [00:06:49] Eles têm um conflito irreconciliável e nada pode acontecer. Nenhum progresso pode ser feito na solução do problema de ação coletiva até que uma dessas duas pessoas faça um movimento contraintuitivo, trocando de cor para roxo ou rosa, e aumentando temporariamente os conflitos. E é, de fato, isso que acontece. E então o tempo passa, e os seres humanos aos 245 segundos resolvem o problema. A máquina detecta a solução, para o jogo e os paga, certo?

Agora, porque fomos astutos, o que fizemos foi alguns experimentos onde substituímos furtivamente alguns dos seres humanos por bots. E avaliamos como a adição de bots dotados de IA para criar um sistema híbrido afetou o desempenho do grupo. É possível adicionar alguns bots a grupos humanos e melhorar a sua capacidade de coordenação quando enfrentam tal desafio? O que fizemos foi adicionar três bots, e variamos experimentalmente dois eixos. Onde os bots foram colocados, onde eles entraram aleatoriamente na rede, onde foram colocados no [00:07:51] centro da rede, ou onde foram colocados na periferia da rede. E manipulamos aleatoriamente a sua capacidade de IA de forma muito trivial e simples. Ou seja, manipulamos se os bots agiam com perfeição ou agiam com um pouco de ruído.

Na situação de perfeição, a cada um segundo e meio, os bots olhavam em volta para os seus vizinhos e então escolhiam a cor que tinha menos conflitos com os seus vizinhos. O que se pode considerar um comportamento irracional. Na situação de 10% de ruído, faziam isso, mas 10% do tempo, escolhiam uma cor aleatória. E na situação de 30% de ruído, faziam isso, mas 30% do tempo, escolhiam uma cor aleatória. Portanto, fizemos com que os bots, digamos, se tornassem cada vez mais propensos a erros, cada vez mais barulhentos.

E então olhamos para, tínhamos, eu penso, algo como, vamos começar com um grupo de controle. Plotamos aqui no eixo x o tempo, e estas são curvas de sobrevivência. No eixo y está a probabilidade de que o grupo como um todo não tenha resolvido o jogo de coordenação. Portanto, aqui, se olharem para aqui, por exemplo, no início, no tempo zero, [00:08:51] 100% dos únicos grupos humanos, as sessões com apenas humanos, estão em laranja. No início, 100% dos grupos apenas humanos não resolveram o jogo. E então, à medida que o tempo passa, cada vez mais grupos humanos resolvem o jogo, de forma que ao final dos cinco minutos, talvez 60% dos grupos apenas humanos tenham resolvido o jogo.

Bem, o que acontece é que se colocar 10% de bots barulhentos na posição central da rede, você obtém um desempenho visivelmente melhorado. Aqui, substancialmente mais grupos de pessoas, quando os bots que tinham um pouco de ruído foram adicionados ao meio, foram capazes de resolver o problema. De fato, eles reduziram o tempo médio de solução de 232 segundos para 103 segundos. E há outras descobertas também nesses dados. Bots perfeitos e bots excessivamente barulhentos foram ambos inúteis. Era necessário algum tipo de calibração. Foram os 10% de bots barulhentos que foram os mais úteis. E também a posição dos bots teve algum impacto. Mas, crucialmente, nesses experimentos, também encontramos que seres humanos que não estavam conectados aos bots, [00:09:52] que estavam mais longe na rede. Assim, nos gráficos, havia algumas pessoas conectadas aos bots e outras que não estavam. Descobrimos que mesmo essas pessoas começaram a mudar a maneira como jogavam. Então, houve um efeito em cascata, um efeito de ondulação. Os benefícios de como o bot estava interagindo com seus humanos se propagaram pela rede e começaram a afetar as interações humanas ainda mais distantes na rede. Em outras palavras, os bots ajudaram os humanos a se ajudarem, e os benefícios do ruído se dispersaram dentro deste sistema social.

Agora deixe-me esclarecer ainda mais as ideias sobre este desafio coletivo e como estes simples agentes de IA podem ajudar com outra analogia. Então, imagine que você tem um plano. Isso é como um gradiente descendente em aprendizado de máquina, por exemplo. Então você tem um plano, e você tem colinas e uma montanha. E você tem diferentes colinas, ok, de diferentes alturas. E você tem uma montanha lá em cima que é a montanha mais alta. Então você vai cair, eu vou levar quatro de vocês, e vou deixá-los aqui, e vou algemar vocês juntos, cada um olhando em uma direção cardinal diferente, [00:10:54] e vou colocar uma venda em vocês. E vou dizer a vocês, encontrem a montanha mais alta. Então vocês conversam entre si e dizem, bem, por que não damos cada um um passo em nossa direção e reportamos de volta para a equipe? Assim, você dá um passo para o norte e diz que está subindo daqui. E o sul diz que está descendo daqui. E o leste e o oeste dizem que está lateral daqui. Então vocês concordam, vamos dar um passo para o norte. E vocês continuam fazendo isso de forma iterativa até chegarem a um ponto em que todos dizem que está descendo daqui.

Vocês encontraram a montanha mais alta? Não. (...) O que vocês fizeram? Encontraram a colina mais próxima.

Agora, alguma vez encontrarás a montanha mais alta? Não. Nunca encontrarás a montanha mais alta. Estás preso. Estás otimizado localmente, mas globalmente sub-otimizado. E para otimizar globalmente, precisas de um pouco de ruído. Precisamos, ocasionalmente, de permitir que este grupo de pessoas dê um passo contraintuitivo para baixo da montanha ou para descer a colina. Assim, eles fazem uma sequência, às vezes por acaso, de uma sequência de passos até voltarem para o plano. E, em seguida, navegam por todo este paisagem de fitness, explorando todos esses picos até que acabem neste pico. [00:11:56] E este alto pico tende, o ótimo global, tende a ser um estado receptor porque leva muito mais ruído para sair desse pico do que dos outros picos. E agora, oscillas ao redor do ótimo global. Assim, no nosso trabalho, temos explorado este tipo de programação simples inserida em sistemas sociais para ver se podemos melhorar o desempenho dos seres humanos na abordagem de diversos tipos de problemas de ação coletiva.

Agora, outro problema de ação coletiva envolve um desafio diferente, que é a cooperação, não a coordenação. Os humanos muitas vezes têm de cooperar para produzir o que é conhecido como bem público. E um farol é um dos exemplos canónicos de um bem público. Um bem público tem duas características canónicas. Antes de mais, é o que se chama não-excludente. E isso significa que outras pessoas não podem ser impedidas de usá-lo. Se você construir um farol para o seu próprio benefício, porque está a navegar nos mares e não quer colidir com a costa, isso é ótimo para si, mas você não pode impedir ninguém mais de usá-lo, ok? Não-excludente. [00:12:58] E também é não-rivalizável. Isso significa que o consumo por uma pessoa não reduz o consumo por outras. Se eu usar a luz do meu farol, não fica menos luz para si usar. E isso é diferente, por exemplo, de um pedaço de bolo. Se eu tenho um pedaço de bolo, é meu, certo? Eu posso impedir que você o coma. E se eu o comer, não sobra nenhum para si, ok? Portanto, o bem público tem essas características, e são essas características que tornam muito difícil produzir bens públicos. Porque quando se trata de construir um farol, é muito tentador colocar seus interesses individuais contra os interesses do grupo. Se você não contribuir para a construção do farol, ainda pode beneficiar dele. E assim, todos são tentados a não fazer nada, e então o farol não é construído, em detrimento de todos. E também vale a pena enfatizar que os bens públicos são úteis, porque com eles você pode realmente produzir coisas, como viagens seguras no mar. E como tal, o subinvestimento em bens públicos é um sério problema na nossa sociedade, e também passou a ser conhecido como a tragédia dos bens comuns. Esses bens públicos, por exemplo, as normas de confiança que mantemos entre nós são eficientes. [00:14:01] Pense em quando você estava no ensino secundário. Alguns de vocês foram para um ensino secundário onde os alunos confiavam uns nos outros, e isso significava que você podia deixar as suas mochilas sozinhas no corredor e não se preocupar que alguém as roubaria. Outros de vocês foram para escolas secundárias onde não havia as mesmas normas de confiança, e agora você tinha de trancar a sua mochila ou mantê-la consigo o tempo todo. Em qual desses dois ambientes você acha que teria um aprendizado melhor? Certo? No primeiro ambiente. Portanto, essa norma que é mantida coletivamente é produtiva. Nesse caso, produtiva de aprendizado. Aqui, produtiva de viagens seguras no mar e assim por diante.

Por isso, a cooperação em grupos humanos para produzir bens públicos é desafiadora, e vários mecanismos são necessários para sustentá-la. Fizemos muitos experimentos que envolvem colocar humanos em grupos de rede e pedir-lhes que joguem diversos tipos de jogos de bens públicos com os seus vizinhos, manipulando várias características estruturais e outras ao longo dos anos. Por exemplo, começámos há anos com um experimento em que as pessoas foram colocadas numa rede como esta. Elas foram apresentadas aos seus vizinhos e jogaram um jogo de bens públicos, como, por exemplo, da economia comportamental, [00:15:03] onde eu poderia dar um pouco de dinheiro a cada um dos meus vizinhos. Supondo que eu pegasse um dólar e o dividisse entre os meus vizinhos. Depois, os cientistas dobram o dólar. Portanto, digamos que eu tenho quatro vizinhos. Digamos que eu tenho três vizinhos, e eu dou um dólar ao grupo. Isso torna-se dois dólares. Esses dois dólares são divididos entre nós quatro. Então, o grupo todo ganha riqueza em dois dólares, mas eu só recebo de volta 50 cêntimos. Os dois divididos por quatro, recebo de volta 50 cêntimos. Portanto, tenho que fazer um sacrifício para o benefício dos outros. Assim, naturalmente, todos dizem: eu não quero sacrificar. Deixem que os outros otários dêem o dinheiro. Eu não vou dar nada, e espero que os outros contribuam. Mas, claro, se todos fizerem isso, haverá um colapso novamente. E o melhor comportamento é que todos contribuam ao máximo. Então, aqui nesta situação, começamos o jogo. Os pontos azuis são as pessoas cooperativas e legais. Eles dão ao máximo aos seus vizinhos e estão a criar bens públicos, como construir o farol. E os pontos vermelhos são os exploradores que não fazem contribuições, conhecidos também como os defeituosos. E o que descobrimos neste experimento é que reproduzimos um resultado que é conhecido há 30 anos, [00:16:03] que é que a cooperação colapsa em grupos, certo? No final do jogo, várias rondas depois, praticamente todos se tornam defeituosos, exceto essas pequenas pessoas azuis aqui ao lado, mantendo a civilização viva, entre eles. Você também pode pensar, novamente, para recordar o ensino secundário para os alunos. Lembrem-se daquela situação em que o seu professor de ciências designou quatro de vocês para fazerem um trabalho em grupo e vocês iam receber a mesma nota. E você é atribuído a outros três perdedores. Agora você tem duas escolhas. Ou você faz todo o trabalho, e eles também recebem A's porque você quer um A. Ou você diz: isso é ridículo. Eu não quero que esses tipos preguiçosos se beneficiem do meu trabalho duro. E você diz: eu não vou fazer nada, e todos vocês recebem F's, certo? Isso é um dilema terrível. Bem, o que acontece aqui é que os seres humanos, eventualmente, escolhem a última opção. Todos optam por receber F's porque não querem ser otários e continuar a contribuir. Portanto, a cooperação colapsa em sistemas sociais como um resultado geral. Mas o que fizemos é que, mais uma vez, adicionámos alguns, embora diferentes, tipos de bots ao sistema. Adicionámos alguns bots que eram dotados de A. [00:17:05] E esses bots eram como pequenos intermediários de casamento. Eles intermediavam interações sociais. Olhavam ao seu redor localmente para ver quem estava a interagir com quem e davam sugestões às pessoas no sistema. Você sabe, você deveria cortar a ligação com aquele defeituoso que está a tirar vantagem de você e formar um laço com este bom rapaz aqui em vez disso. E este conselho gentil de reestruturação que usa apenas conhecimento local. Não há professor a ordenar às pessoas que sejam legais. Não há polícia. Não há tribunal. Não há autoridade centralizada a executar isso. Apenas atuando com conhecimento local, descobrimos que esses bots poderiam, nos nossos experimentos com mais de 1.000 pessoas em 64 grupos, não só estabilizar a cooperação, mas pela primeira vez, mostramos um resultado de que a cooperação poderia, de fato, aumentar a partir da linha de base quando esses tipos de bots foram adicionados. E a DeepMind posteriormente replicou os nossos resultados e os estendeu em outro artigo que apareceu cerca de um ano ou dois depois deste.

Agora, em mais um experimento, explorámos como os bots podem afetar a criatividade do grupo. [00:18:07] porque encontrar novas ideias é difícil. E a teoria e os experimentos sugerem que os grupos podem ser melhores a identificar e preservar inovações do que os indivíduos ao partilhar as suas descobertas.

Mas a inovação dentro dos grupos enfrenta os seus próprios desafios, incluindo o pensamento de grupo. Certo? Se juntar um grupo de pessoas, podem convergir prematuramente para uma ideia subótima.

Ou você pode imaginar, deve imaginar, que um grupo de pessoas pode coletivamente ter mais sabedoria, pode conseguir apresentar mais ideias. Por exemplo, se você der ao grupo a tarefa de aperfeiçoar uma vara de pescar, você sabe, a primeira pessoa pode dizer, bem, por que não colocamos um gancho na ponta de uma corda? E então a pessoa está segurando a corda com um gancho. E alguém diz, por que não adicionamos um pau à corda? Oh, isso é uma ótima ideia. Então eles combinam o seu conhecimento e fazem isso. E alguém diz, bem, a isca com o gancho está flutuando à superfície. Vamos adicionar uma onda para que desça. Bem, agora desce demais. Que tal adicionarmos um flutuador para sabermos onde está e assim por diante. E assim as pessoas inovam, partilham conhecimento entre si, preservam conhecimento ao longo do tempo, [00:19:08] e você obtém esses artefatos culturais que são o produto composto de múltiplas pessoas a partilhar ideias e a ser criativas.

Assim, queríamos criar um jogo em que grupos de pessoas procurassem numa paisagem por uma ideia ótima. E decidimos usar substantivos como um proxy para ideias. E escolhemos 20.000 substantivos do corpus clássico de word-to-vec da ciência da computação. Portanto, escolhemos 20.000 substantivos. E a distância entre esses substantivos poderia ser definida pela métrica de similaridade cosseno. Você pode imaginar um espaço vetorial hiperdimensional em que gato é mais similar a cachorro do que a mesa. E a maneira como eles fizeram isso foi analisando com que frequência as palavras gato e cachorro apareciam juntas em websites. Portanto, eles tinham um universo de websites e um universo de 20.000 substantivos. E disseram que esses dois substantivos costumam aparecer juntos e esses dois outros substantivos não costumam aparecer juntos. Eles criaram um espaço vetorial de 300 dimensões. [00:20:08] E agora você pode descrever quão similares são quaisquer dois substantivos. E decidimos usar substantivos como um proxy para ideias. Pegamos esses 20.000 substantivos. E depois escolhemos um conjunto de substantivos. Imagine que escolhemos um substantivo, mas escolhemos um conjunto. Um substantivo aleatório de todos esses, como braggadocio, por exemplo, era um substantivo. Portanto, escolhemos braggadocio. E dizemos que essa é a ideia perfeita que queremos que este grupo de pessoas encontre. E então todos os substantivos que estão próximos de braggadocio caem neste espaço vetorial. Assim, você tem o substantivo de pico que recebe mais pontos, 20.000 pontos, e todos os outros substantivos até os mais distantes. E colocamos seres humanos neste sistema e dizemos, encontre esta palavra. Não lhes dizemos a palavra. E depois informamos o valor em pontos das palavras. Assim, eles começam a adivinhar. E à medida que adivinham, recebem feedback. E dizem, ah, esta palavra tem mais pontos do que outra palavra. E eles vão chegado mais perto e começam a compartilhar o conhecimento entre si. Estão tentando ser criativos para resolver o problema.

Assim, cada substantivo está relacionado a outros em um espaço semântico ou uma paisagem sem ajuste. [00:21:10] E tivemos 18 diferentes substantivos-alvo, como se tivéssemos puxado um pico da paisagem desses 20.000 substantivos em 18 locais diferentes em 18 paisagens distintas. E esses substantivos eram deliberadamente incomuns, como fratricídio, calço, sarcoma, cartografia e assim por diante. E então realizamos experimentos envolvendo várias condições onde as pessoas estavam sozinhas tentando navegar pela paisagem, onde as pessoas estavam em grupos trabalhando juntas para navegar pela paisagem, ou onde as pessoas estavam em grupos, mas também tinham alguns bots lá tentando ajudá-las a serem criativas. E os bots funcionaram porque podiam passar informações de uma região da rede para outra, comunicando-se entre si. Por exemplo, o bot número dois poderia passar a palavra céu ou carro para o bot número um. Então, aqui está um exemplo de rede.

Nós introduzimos as pessoas. Os pontos quadrados são bots. E este bot tem quatro interações e este bot tem, não sei, seis ou sete interações. Os seres humanos no início começam a adivinhar. [00:22:12] Eles não têm qualquer base para um palpite na primeira rodada do jogo. Eles adivinham céu, carro, coelho, rato, cão, gato, mesa. Como se eu perguntasse a vocês, escolham um substantivo para adivinhar, vocês escolheriam casa ou sol ou lua ou gato ou cão ou algum substantivo pequeno típico. E agora eles são informados sobre o valor em pontos, como de semelhante é a palavra rato, cão, gato, mesa, e assim por diante, em relação à sarcoma. E eles recebem o valor em pontos desses substantivos em relação ao substantivo alvo, que é sarcoma. E então esses valores em pontos são anunciados a eles. E então este bot pode olhar para os valores em pontos dos humanos ao seu redor e pode transmitir ou uma escolha aleatória para este bot ou o maior valor em pontos ou o menor valor em pontos, uma espécie de canal de comunicação pelos fundos disseminando informações de uma região de um grupo de pessoas tentando resolver o problema para outra região. Então vamos olhar alguns exemplos para entender melhor isso, porque isso pode ser difícil de compreender. As pessoas jogaram este jogo por cerca de 25 rodadas. E aqui está a similaridade cosseno com um substantivo alvo, que é a palavra fratricídio. Ok, então são 20.000 substantivos. [00:23:13] O fratricídio tem 20.000 pontos. E as outras palavras têm outros pontos. E aqui está uma pessoa sozinha, uma pessoa por conta própria que está adivinhando. Então seu primeiro palpite é bit. E eles são informados sobre quão semelhante é a palavra bit ao fratricídio. E então seu próximo palpite é nascimento. E eles obtêm um grande aumento na similaridade cosseno, porque você pode imaginar que a palavra nascimento está mais próxima da palavra fratricídio do que a palavra bit. Ok? E então eles tentam dinheiro a seguir. Isso é pior. Depois eles tentam macaco. Isso é ainda pior. Eles verificam. Fazem uma verificação de sanidade. Eles tentam nascimento. Isso aumenta novamente. Depois tentam bebê. Não é um mau palpite. Nascimento para bebê. Mas bebê os afasta mais do fratricídio. E então dama e assim por diante. E eles navegam. E estão adivinhando. E estão adivinhando. E estão adivinhando. E não chegam perto do fratricídio no final. Agora, nesta outra situação, temos um grupo de pessoas, mas sem bots. E agora as pessoas podem, além de fazerem os seus próprios palpites, ver os palpites das pessoas ao seu redor. E construir sobre as ideias dos outros. Ok? Criado. Como fazer a vara de pescar juntos. [00:24:13] Então esta pessoa, o seu primeiro palpite é cão. Mas o seu próximo palpite é escudo. Você pode ver que escudo está mais próximo de fratricídio do que cão. E esta pessoa está adivinhando e adivinhando e recebendo input dos seus vizinhos. E, no final, ele se aproxima cada vez mais. Ele termina com a palavra inimigo. Ok? Na verdade, soldado foi o seu melhor palpite. Teve o maior valor em pontos durante sua trajetória.

Então, como é que a adição dos bots fez diferença? Isto, novamente, mostra o resumo dos resultados. No eixo x está a ronda. No eixo y está a média de semelhança cosseno neste espaço vetorial hiperdimensional, que é uma medida do desempenho do grupo. E aqui está um grupo de humanos que estão a agir, a adivinhar sozinhos. Portanto, os humanos que estão a adivinhar por conta própria não se saem muito bem, certo? Eles, eles, sabem, é apenas uma questão de sorte se conseguem de alguma forma, ou, sabe, alguma capacidade inata em cada humano individual. Eles ficam um pouco melhores com o tempo, aproximando-se. Todos os grupos superam os indivíduos sozinhos. E este é um resultado antigo que é conhecido. Um grupo de pessoas é mais criativo do que um conjunto de praticantes individuais de tamanho semelhante. Mas o que encontramos é que, se adicionarmos o bot mais semelhante, o bot que olhou para os seus vizinhos, [00:25:17] e descobriu qual é o seu consenso local sobre aqui? Meus humanos parecem pensar que esta é uma boa palavra. E depois passa para o bot em uma parte distante da rede. Esse bot melhorou substancialmente o desempenho deste grupo de pessoas para fazer uma descoberta. Você deve ser capaz de imaginar como isso poderia funcionar em um grupo de engenheiros ou qualquer outro trabalhador do conhecimento. Como, por exemplo, você pode distribuir conhecimento de maneira eficiente, evitando o pensamento de grupo e promovendo a criatividade, ao projetar bots que ajudam os humanos a ajudarem-se a si mesmos. O bot aqui não tem, não tem um cérebro. Não está, está a sugerir ideias por conta própria. Está apenas a ajudar os humanos a espalhar as ideias entre si.

Portanto, agentes de IA simples com comportamento interpretável podem aumentar a capacidade de descoberta criativa em grupos humanos ao partilhar ideias em torno das quais há consenso local em uma parte do grupo com pessoas em uma parte distante do grupo. E, como resultado, o grupo pode ter um desempenho melhor.

Agora, também começámos a experimentar com sistemas físicos. E adicionámos robôs humanoides e não humanoides [00:26:19] dotados de IA simples a grupos de humanos em interação cara a cara e mostramos como eles podem facilitar a colaboração entre grupos de humanos, ajudando-os a ultrapassar atritos ou uma incapacidade de cooperar nas suas interações. Um dos meus exemplos favoritos disso é um experimento que fiz com a minha antiga aluna de mestrado, Maggie Traeger, que está ao fundo e agora é professora assistente na Notre Dame, que é este experimento. Neste experimento, trouxemos três humanos reais que entraram no laboratório e um robô humanoide. E projetámos um pequeno jogo, um jogo de trilhos de comboio, que é jogado num tablet, e este grupo de humanos e um robô tinha a tarefa de colocar trilhos de comboio do ponto A ao ponto B, como os pequenos trilhos do Thomas, o Comboio. E depois oferecemos algumas peças que eles podiam escolher no tablet, como peças rectas e peças curvas. Mas ocasionalmente, embora parecesse que havia uma mistura de peças e que, em princípio, deviam conseguir ir do ponto A ao ponto B, nós projetámos de forma astuta que não havia o número certo de curvas para lhes permitir ir do ponto A ao ponto B. [00:27:21] Portanto, não conseguiam realizar a tarefa. Não conseguiam resolver o problema, sem o saber. Certo? Assim, primeiro cada pessoa fazia a sua vez colocando uma peça de trilho, depois a próxima pessoa e a próxima. Estavam a trabalhar juntos para ligar o ponto A ao ponto B nos seus tablets.

E o que fizemos neste experimento foi manipular, e eles jogaram 30 rondas deste jogo neste mundo virtual, e tivemos 51 grupos, manipulámos o estilo de conversação dos robôs, especificamente se o robô expressava vulnerabilidade ao admitir um erro. Assim, o robô disse, sabem, eu cometi um erro. Ou se o robô contava piadas de pai. Presumo que todos saibam o que são piadas de pai. Certo. Portanto, também fizemos com que o robô contasse, a propósito, isso é um universal cultural, como antropólogos na selva amazónica olharam para os povos indígenas e os pais lá também contam piadas de pai. E as crianças ficam tipo, não consigo acreditar nas piadas estúpidas do papá. Mas, de qualquer forma, e na verdade há uma teoria sobre o que as piadas de pai são destinadas a reforçar as crianças de certa forma. Esta é uma teoria. Mas, de qualquer forma, isso é um tema totalmente diferente. Enfim, tivemos os nossos robôs a contar piadas de pai ou a expressar vulnerabilidade. [00:28:21] E o que nos interessava descobrir era se mudanças na fala dos robôs tinham o poder de não apenas afetar como as pessoas interagem com os robôs, mas também como as pessoas interagem entre si. E mais uma vez, isso oferece a perspetiva de modificar interações sociais pela introdução de agentes artificiais em sistemas híbridos de humanos e máquinas.

Então aqui está um pequeno exemplo de, oh, e eu não te contei os resultados. Então aqui estão, aqui está quando temos, então estas, a espessura destas linhas, montámos câmaras de vídeo para monitorizar quem está a falar com quem e quanto tempo estão a falar. E a espessura destas linhas indica quanto a pessoa dois está a falar com a pessoa um e assim por diante. Então a pessoa um não fala muito com o robô. Essa é uma linha fina. E quando tiveste robôs neutros, obténs este padrão. Mas quando tiveste o robô vulnerável, todas estas linhas ficam mais grossas e igualam-se. Portanto, descobrimos que um robô vulnerável aumentou a igualdade na fala entre os humanos, aumentou o volume de fala entre os humanos e, de facto, em resultados separados, [00:29:22] aumentou a satisfação dos humanos nesse tipo de ambiente.

E aqui está apenas um clipe de duas rondas diferentes que ilustram que o robô fala de forma neutra primeiro, na voz passiva, o que não afeta muito a comunicação humana. o robô diz, de uma forma muito à Reagan, um erro foi cometido.

Mas na próxima ronda, o robô diz, eu cometi um erro. E podes apenas ver o que acontece aqui. Vamos ver se conseguimos fazer isto funcionar. (pausa de 25 segundos) Portanto, ao longo de muitas, muitas dezenas de repetições, este é o tipo de padrão que encontramos. Portanto, uma manipulação simples, uma manipulação simples no padrão de fala do robô muda a forma como os humanos interagem entre si. [00:30:25] E não, estou a assumir, não leva muito a imaginar como toda a forma como projetamos os nossos chatbots e tudo o mais pode estar a afetar não apenas o exemplo da Alexa que te dei no início, como nos tratamos uns aos outros. Os humanos parecem confiar mais uns nos outros e ter mais diversão nesta situação.

Agora aqui está ainda, e eu acho que este é o último experimento que vou mostrar a vocês e depois vou encerrar, em mais um experimento, desenvolvemos uma nova plataforma ciber-física para testar tais efeitos sociais e de facto éticos de tipos simples de IA. Porque dada a natureza dos problemas de ação coletiva, o envolvimento da IA em grupos humanos poderia paradoxalmente e inadvertidamente suprimir normas sociais benéficas existentes nos humanos, como aquelas que envolvem cooperação e altruísmo que evoluímos como espécie para ter. Portanto, temos centenas de milhares de anos de seleção natural a trabalhar em nós para nos tornar capazes de resolver problemas de ação coletiva. Então a questão é, bem, se delegarmos parte dessa agência a máquinas, perderemos a capacidade de trabalhar juntos para resolver esses problemas? [00:31:32] Vamos começar a depender dessas máquinas, e assim degradamos nossa habilidade inata de cooperar e coordenar e criar e assim por diante? Assim, neste experimento, colaborando com Hiro Shirato na CMU, outro ex-aluno de graduação meu, construímos uma plataforma que envolveu dois pequenos veículos mecânicos dotados de Raspberry Pi, e conectámo-los a um software que temos que nos permite organizar experimentos online em uma escala vasta. Assim, as pessoas estavam em suas próprias casas, e foram designadas a um desses carros, e estavam dirigindo esses carros uma em direção à outra,

e fizemos com que jogassem o jogo do frango. Assim, no frango, você sabe, como, quem chegar ao outro lado mais rápido ganha. Assim, você tem o incentivo para não ceder ao outro. Mas se ambos escolherem não ceder, então vocês colidem, e ambos têm o pior resultado. Assim, o que os humanos fariam nessa situação, se você estiver jogando um jogo de frango iterado, é que você aprenderia rapidamente a revezar. Desta vez é a sua vez de ir direto, eu vou encostar e deixar você passar, mas na próxima vez você encosta e me deixa ir direto. [00:32:35] Se formos egoístas, apenas continuamos colidindo um com o outro, como se destruíssemos um ao outro vez após vez após vez, ou estupidamentes, ambos desviamos, e nenhum obtém o benefício de ir direto. Assim, nesta situação aqui, o carro amarelo decide encostar, o carro azul simplesmente prossegue sem impedimentos até o outro lado.

E utilizámos 300 participantes e 150 duplas, e eles foram pagos dependendo da rapidez com que chegavam ao outro lado. Depois, adicionámos alguma IA. Introduzimos assistência à travagem automática, onde, ao receber um alerta de proximidade, quando se aproximava de outro carro, ele travava e dava-lhe a oportunidade de decidir, eh, eu devo encostar e deixar passar este outro tipo, ou vice-versa. Ou introduzimos assistência à direção automática, que é, no momento em que se aproximava do outro carro, simplesmente desvia-se, certo? E adicionámos uma função de comunicação mínima, onde as pessoas podiam dizer obrigado, ou algo do género. Apenas uma comunicação muito mínima. E primeiro, demonstrámos que a assistência à travagem automática, onde os carros param a uma distância fixa antes de colidir, aumentou o altruísmo humano. [00:33:38] Ou seja, dar passagem aos outros, como faz o carro amarelo aqui. Assim, a adição de um pouco de assistência à travagem automática em IA facilitou a colaboração e a cooperação entre os seres humanos nesta situação. Além disso, permitir que os humanos se comuniquem ajuda ainda mais a fazer concessões mútuas na condição de travagem automática. Por outro lado, a assistência à direção automática, onde o carro simplesmente desviava, inibia completamente o surgimento de reciprocidade entre as pessoas em favor da maximização do interesse próprio. As pessoas simplesmente entregam a sua agência moral. Elas já não se preocupam mais. Deixam apenas a máquina desviar-se repetidamente, e desistem, certo? Assim, todas as capacidades éticas inatas que as pessoas tinham foram agora removidas pela adição de IA na condição de direção automática, mas melhoradas na condição de travagem automática. E isso também deveria fazer-vos refletir. Deveriam estar a pensar, oh meu Deus, cada pequeno detalhe que fazemos quando programamos estes agentes de IA pode ter efeitos bons ou maus nas tendências naturais das pessoas.

A capacidade das pessoas de cooperar, revezar-se e agir de forma altruísta pode atrofiar, levando a piores resultados coletivos e individuais no final. [00:34:46] E, na verdade, em resumo, a IA pode levar a uma espécie de preguiça moral. (..) Aqui está um último exemplo de mudança duradoura após a exposição à IA em sistemas híbridos. E também é um exemplo de como a presença da IA pode mudar as interações entre humanos, mesmo depois de a IA não ser mais parte das interações. Assim, em 2016, a DeepMind desenvolveu o AlphaGo, e nesse mesmo ano, este agente de IA jogou contra Lee Sedol, o notável campeão mundial da Coreia.

Assisti ao jogo. Não sei jogar Go, mas reconheço que é um jogo magnífico. O meu filho joga Go. (.) E eu estava realmente a torcer por Lee Sedol. Lee Sedol é como um herói na Coreia, como a maneira como teríamos, sabe, grandes atletas nas nossas caixas de Wheaties e coisas assim. O dele está em pacotes de noodles e em pacotes de cereais. Como, acho magnífico que na Coreia um nerd inteligente como eu seja visto como uma pessoa importante, ok? Portanto, ele é muito popular na Coreia. E ele entra para o primeiro jogo, e ele está demasiado confiante. [00:35:47] Eu consigo perceber que ele está demasiado confiante. E ele perde para a máquina, e depois pede desculpas aos seus fãs. Ele diz: Peço muitas desculpas. São cinco jogos. O melhor de três dos cinco ganha. Então, ele joga um segundo jogo e perde de novo. E agora ele está a ficar sério. Depois joga um terceiro jogo e perde. Ele perdeu a competição.

E podia-se ver meio que a audiência, e os comentadores estavam maravilhados com a habilidade da máquina de jogar Go, fazendo esses movimentos estranhos e bonitos, alguns dos quais descobriram mais tarde que tinham sido jogados porque temos registros que remontam a milhares de anos de jogos de Go jogados na Corte Imperial Chinesa. E podiam descobrir, oh, meu Deus, este é um movimento medieval que a máquina fez. Não o tínhamos visto há tanto tempo.

E então, Lisa Dahl volta no quarto jogo, e ele vence. (..) E eu chorei. Fiquei tão feliz. (..) Porque ele tinha a máquina, você sabe, ele tinha voltado pela minha espécie, e ele havia derrotado a maldita máquina. Como, de forma heróica, eu não conseguia entender, como, a capacidade cerebral que deve ter sido necessária para Lisa Dahl fazer isso. [00:36:49] Eu estava extasiado naquele momento e tão orgulhoso dele por ainda estar tentando, mesmo depois de ter perdido a partida.

Agora, o que é interessante é que, quando Lisa Dahl foi entrevistada depois, Lisa Dahl disse que a sua própria forma de jogar mudou após a partida. Portanto, mais uma vez, a IA está a ajudar os humanos a ajudarem-se a si próprios, certo? Ele muda como joga por causa do contato. E investigações subsequentes por outros cientistas analisaram jogadores profissionais de Go e examinaram a qualidade medianas das decisões. Existe um padrão no Go para avaliar quão boa é uma jogada e a novidade mediana, como quão incomum é uma jogada. E descobriram que, quando o AlphaGo derrota o campeão mundial humano em 2016, em todo o mundo, jogadores de Go começam a fazer jogadas melhores e mais inovadoras, certo? Portanto, todos os humanos que jogam Go entre si mudaram porque o AlphaGo foi adicionado. A IA ajuda os humanos a ajudarem-se a si próprios. Assim, estamos a continuar a desenvolver o nosso trabalho para projetar e adicionar bots simples a estas e outras situações que envolvem dilemas sociais e problemas de ação coletiva. [00:37:55] Estamos a analisar como os bots podem afetar a coordenação, cooperação, comunicação, criatividade, confiança, navegação, partilha e evacuação. E no nosso laboratório, não nos estamos a concentrar em IA super inteligente, como LLMs ou AlphaGo, para substituir a cognição humana, mas sim em IA simples para suplementar a interação humana. Não estamos a tentar inventar uma IA super inteligente para substituir a cognição humana. Estamos a inventar IA simples para suplementar a interação humana. E a nossa IA pode ser simples porque os humanos são inteligentes. A nossa IA é como o platina adicionado a uma reação de química orgânica. É apenas um catalisador. Tudo o que precisamos é do catalisador para ajudar um grupo de pessoas a melhorar.

E claro, é importante reconhecer que o oposto também é possível. A IA social pode ser usada para prejudicar grupos de pessoas. Mas a nossa abordagem oferece uma série de outras vantagens técnicas e conceptuais. Em primeiro lugar, estes simples bots são inteligíveis e, portanto, ilustram claramente poderes e oportunidades mais amplos. Ao contrário dos LLMs, que são uma caixa-preta e você não sabe o que estão a fazer, eu posso dizer-lhe exatamente o que o nosso bot está a fazer. [00:38:58] Está a fazer barulho. Está a intermediar apresentações. Está a passar mensagens desta forma muito específica. E em segundo lugar, os nossos experimentos controlados de bots também podem fornecer insights sobre como o comportamento humano poderia mudar de forma benéfica. Em outras palavras, eu posso levar isso do laboratório e ensinar um grupo de humanos a fazer o que os nossos bots fizeram. De certa forma, você não pode ensinar facilmente um grupo de humanos a fazer o que o ChachiPT fez aqui. Não sabemos o que o ChachiPT está a fazer, mas você sabe o que eles estão a fazer na nossa situação.

Gostaria de terminar, esta é a minha última apresentação, com uma metáfora. Considere estes dois objetos. Ambos são feitos de carbono. Se pegar os átomos de carbono e conectá-los de uma forma, você obtém grafite, que é macio e escuro. Pegue os mesmos átomos de carbono e conecte-os de outra forma, você obtém diamante, que é duro e claro. E existem duas ideias intelectuais chave aqui. Primeiramente, essas propriedades de maciez e escuridão e dureza e clareza não são propriedades dos átomos de carbono. Elas são propriedades da coleção de átomos de carbono. E em segundo lugar, quais propriedades você obtém depende de como conecta os átomos de carbono entre si. Pegue os mesmos átomos de carbono e conecte-os de uma forma, você obtém um conjunto de propriedades. [00:40:01] Conecte-os de outra forma, você obtém um conjunto completamente diferente de propriedades. Da mesma forma, a natureza das nossas conexões afeta as propriedades dos nossos grupos sociais. São os vínculos entre as pessoas que podem fazer o todo ser maior do que a soma das suas partes. Novas propriedades, como cooperação e violência, inovação e produtividade, confiança e desconfiança, verdade e falsidade, riqueza e pobreza, saúde e felicidade, podem emergir e se espalhar por causa das conexões, por causa dos laços entre as pessoas, e não necessariamente apenas por causa das próprias pessoas. De fato, a nossa experiência do mundo depende da estrutura e função das redes ao nosso redor, próximas e distantes. E a nossa espécie evoluiu para que isso fosse o caso. E não deve nos surpreender que responderemos à IA em nosso meio. Muito obrigado.

Similar Posts