Nicholas Christakis – Conferencia sobre IA Centrada en la Sociedad

Nicholas Christakis: [00:00:05] Muy bien, los seres humanos están integrados en redes sociales, y estas redes obedecen a principios matemáticos, biológicos y sociales muy particulares. Y cada vez más, estamos añadiendo inteligencia artificial en forma de agentes en línea y robots físicos entre nosotros que interactúan con nosotros como si fueran entidades sociales. Y estos tipos de agentes que vamos a agregar a nuestros sistemas varían desde autos sin conductor en las carreteras hasta máquinas de pago en las tiendas, hasta robots humanoides en hogares o en fábricas o en campos de batalla o en situaciones de lucha contra incendios, hasta agentes autónomos desencarnados como bots en línea y asistentes digitales de IA en nuestros teléfonos o nuestras gafas o nuestros lugares de trabajo. Y estas tecnologías interactúan con nosotros en igualdad de condiciones como si fueran humanos. Y darán lugar a sistemas híbridos de humanos y máquinas. Y estos sistemas ofrecen oportunidades para un nuevo tipo de inteligencia artificial social.

Ahora, déjame darte solo un ejemplo sencillo de esto. Cuando tienes, por ejemplo, un asistente digital, como un Alexa, el fabricante de ese dispositivo está muy preocupado por la interacción humano-máquina. Y esa interacción humano-máquina está optimizada. Por ejemplo, nunca comprarías el Alexa si cada vez que necesitabas algo de él, tuvieras que decir: disculpa, Alexa, lamento interrumpirte. Si no te importa, ¿podrías decirme la palabra? [00:01:35] clima mañana, ¿verdad? Esto sería considerado un nivel absurdo de cortesía. Esperas poder decir: Alexa, clima, y entonces la máquina responde obedientemente. Y eso está bien hasta que traes esa máquina a tu casa y tus hijos hablan con esa máquina y aprenden a ser groseros. Y luego van al parque y son groseros con otros niños. Así que esa máquina que ha sido añadida a nuestro entorno, no se trata solo de la interacción humano-máquina, se trata de la interacción humano-humano en presencia de máquinas. Y así, lo que me interesa no es si eso, son las interacciones humano-humano en presencia de máquinas. Y podemos usar un entendimiento de la estructura y función de la red social para evaluar los usos e impactos de la IA social dentro y sobre los grupos humanos, con respecto a factores como la confianza y la cooperación que son necesarios para que grupos de personas trabajen juntos, y que afectan el comportamiento de estas colectividades.

Permítanme resaltar parte del trabajo que estamos realizando, usando varios enfoques para experimentos de red que involucran inteligencia artificial. Estos experimentos evalúan cómo la IA podría afectar la estructura y función de las interacciones sociales humanas. [00:02:45] Ahora hay una clase de problemas de acción colectiva de interacciones sociales que conocemos como problemas de coordinación. Es decir, son problemas en los que debemos trabajar juntos si queremos crear algo útil. A veces, resolvemos estos problemas creando instituciones centralizadas como la policía, los tribunales o los gobiernos. Pero a menudo podemos resolver problemas de acción colectiva que requieren que nos coordinemos o cooperemos con un gran número de personas de manera descentralizada. De hecho, hemos evolucionado para tener esta capacidad. Y un tipo específico de problema de acción colectiva con el que me gustaría empezar hoy es, de hecho, la coordinación.

Por ejemplo, para evitar este embotellamiento, las personas tienen que coordinarse para hacer algo diferente de sus vecinos. Así que si todos salen de sus casas al mismo tiempo, todos quedan atrapados en un embotellamiento. Pero si ajustan sus horarios de salida y salen en intervalos, entonces nadie queda atrapado en el embotellamiento. Ahora, por supuesto, podrías tener algún tipo de autoridad central que coordinara esto. Ustedes salen primero, luego ustedes, y luego ustedes. [00:03:45] Pero idealmente, lo que querrías es algún tipo de forma de coordinación humana descentralizada, no de arriba hacia abajo, para resolver este problema.

Así que aquí estuvo nuestro primer experimento que se publicó en 2017 sobre sistemas híbridos que exploraron cómo la IA podría ayudar con tal desafío. Y exploramos el rendimiento de grupos humanos que estaban comprometidos en una tarea de coordinación. Y nuestro paradigma fue tomar prestado de la informática algo conocido como el problema de coloreado de grafos. Este es un problema clásico en informática. Pero lo que hicimos fue tomarlo y poner seres humanos en esa situación. Así que lo que hicimos fue reunir a 4,000 personas y las colocamos en 230 grupos en línea. Así que estos seres humanos fueron asignados aleatoriamente a un lugar dentro de una red artificial que creamos, cuya estructura se asemejaba aproximadamente a las redes humanas reales. Y fueron ubicados en estos lugares y se les dijo que se les asignó uno de tres colores, [00:04:46] un púrpura, naranja, púrpura, naranja y rosa. Y se les dijo que tenían que elegir un color diferente de sus vecinos.

Y se les dieron cinco minutos para hacer eso. Así que estas personas miraban a sus vecinos. Cada persona miraba alrededor y decía, como, este tipo aquí es rosa. Ve que tiene un vecino rosa y un vecino naranja. Lo que debería hacer es cambiar al color púrpura. Y las líneas rojas aquí indican conflictos de color. En otras palabras, si los dos colores de nodos adyacentes son los mismos, obtienen una línea roja. Y las líneas púrpuras de fondo indican la estructura de las interacciones sociales. Así que pones a las personas aquí. Miran a sus vecinos cada segundo o segundo y medio. Hacen un cambio consistente con el objetivo de que todos deben elegir un color diferente al de sus vecinos durante los próximos cinco minutos. Y si lo hacen, entonces y solo entonces se les pagará. Les voy a pagar a ustedes para que trabajen juntos. Y si todos trabajan juntos de manera descentralizada para resolver el problema, todos recibirán el pago. De lo contrario, no recibirán nada, ¿de acuerdo? Entonces aquí está lo que sucede en este experimento. Aquí en el eje x está el tiempo en segundos hasta el límite de cinco minutos. [00:05:47] El juego dura cinco minutos, aquí abajo en algún lugar. Y aquí en el eje y está la función objetivo o el número de conflictos de color. Así que aquí al principio, hay 12 conflictos de color. Se asignan aleatoriamente sus colores iniciales. Y eso se muestra aquí en este pequeño histograma. Así que las personas comienzan a mirar alrededor y cambiar sus colores. Sabes, cambian y cambian. Y llegan a este punto donde ahora han alcanzado la situación en la que hay un conflicto de color entre estas dos personas. Y este conflicto, sin embargo, es lo que llamamos un conflicto irresoluble. Así que las líneas de color naranja claro son conflictos resolubles. Ese es este tipo aquí. Puede hacer un movimiento a púrpura que resuelve el conflicto. Pero estos tipos aquí que son naranjas, no hay movimiento que puedan hacer que reduzca el número de conflictos de color en su vecindario, ¿verdad? Este tipo no puede cambiar a púrpura porque, de hecho, si cambia a púrpura, tendrá más conflictos. Tiene, como, cuatro vecinos púrpuras. Y no puede cambiar a rosa porque tiene dos vecinos rosas. Así que mira y dice, bueno, el menor conflicto que tengo es quedarme naranja. Así que ahora este grupo está estancado, ¿verdad? [00:06:49] Tienen un conflicto irresoluble y no puede suceder nada. No se puede avanzar en la solución del problema de acción colectiva hasta que una de estas dos personas haga un movimiento contraintuitivo, cambie de color a púrpura o rosa, y aumente los conflictos temporalmente. Y eso, de hecho, es lo que sucede. Y luego pasa el tiempo, y los seres humanos a los 245 segundos resuelven el problema. La máquina detecta la solución, detiene el juego y les paga, ¿de acuerdo?

Ahora, debido a que fuimos astutos, lo que hicimos fue realizar algunos experimentos donde sustituimos subrepticiamente a algunos de los seres humanos por bots. Y evaluamos cómo la adición de bots dotados de IA para crear un sistema híbrido afectó el rendimiento del grupo. ¿Es posible agregar algunos bots a grupos humanos y mejorar su capacidad de coordinación al enfrentar tal desafío? Lo que hicimos fue agregar tres bots y variamos experimentalmente dos ejes. Dónde se colocaron los bots, dónde se les hizo caer al azar en la red, si se les colocó en [00:07:51] el centro de la red, o si se les puso en la periferia de la red. Y manipulamos aleatoriamente su capacidad de IA aquí de una manera muy trivial y simple. Es decir, manipulamos si los bots actuaban con perfección o actuaban con un poco de ruido.

En la situación de perfección, cada segundo y medio, los bots miraban a su alrededor a sus vecinos y luego elegían el color que tenía menos conflictos con sus vecinos. Lo que podrías pensar como comportamiento irracional. En la situación de 10% de ruido, hacían eso, pero el 10% del tiempo, elegían un color al azar. Y en la situación de 30% de ruido, hacían eso, pero el 30% del tiempo, elegían un color al azar. Así que hicimos que los bots, digamos, fueran cada vez más propensos a errores, cada vez más ruidosos.

Y luego observamos, tuvimos, creo que algo así, empecemos con un grupo de control. Aquí trazamos en el eje x el tiempo, y estas son curvas de supervivencia. En el eje y está la probabilidad de que el grupo en su conjunto no haya solucionado el juego de coordinación. Así que aquí, si miras aquí, por ejemplo, al principio, en el tiempo cero, [00:08:51] el 100% de los grupos solo humanos, las sesiones con solo humanos, están en naranja. Al principio, el 100% de los grupos solo humanos no han solucionado el juego. Y luego, a medida que pasa el tiempo, cada vez más grupos humanos resuelven el juego, así que al final de los cinco minutos, tal vez el 60% de los grupos solo humanos han solucionado el juego.

Bueno, lo que sucede es que si pones un 10% de bots ruidosos en la posición central de la red, obtienes un rendimiento notablemente mejorado. Aquí, un número considerablemente mayor de grupos de personas, cuando se añadieron bots con un poco de ruido al medio, pudieron resolver el problema. De hecho, redujeron el tiempo medio de solución de 232 segundos a 103 segundos. Y hay otros hallazgos también en estos datos. Los bots perfectos y los bots excesivamente ruidosos fueron poco útiles. Necesitabas algo de calibración. Fueron los bots ruidosos del 10% los que resultaron ser los más útiles. Además, la posición de los bots también tuvo cierto impacto. Pero, crucialmente, en estos experimentos, también descubrimos que los seres humanos que no estaban conectados a los bots, [00:09:52] que estaban más alejados en la red. Así que en los gráficos, había algunas personas que estaban conectadas a los bots y otras que no. Descubrimos que incluso esas personas comenzaron a cambiar la forma en que jugaban. Así que hubo un efecto en cadena, un efecto de cascada. Los beneficios de cómo el bot interactuaba con los humanos se propagaron a través de la red y comenzaron a afectar las interacciones humanas entre sí, más y más lejos en la red. En otras palabras, los bots ayudaron a los humanos a ayudarse a sí mismos, y los beneficios del ruido se dispersaron dentro de este sistema social.

Ahora déjame corregir más ideas sobre este desafío colectivo y cómo estos simples agentes de IA podrían ayudar con otra analogía. Imagina que tienes un plano. Así es como en el descenso de gradiente en el aprendizaje automático, por ejemplo. Tienes un plano, y tienes colinas y una montaña. Y tienes diferentes colinas, ¿de acuerdo?, de diferentes alturas. Y tienes una montaña muy arriba que es la más alta. Así que te voy a soltar, voy a tomar a cuatro de ustedes y los voy a soltar en algún lugar aquí, y los voy a manillar juntos, cada uno mirando en una dirección cardinal diferente, [00:10:54] y los voy a vendar los ojos. Y les voy a decir que encuentren la montaña más alta. Entonces ustedes hablan entre ustedes y dicen, bueno, ¿por qué no cada uno da un paso en su dirección y reporta de vuelta al equipo? Entonces das un paso hacia el norte y dices que está en subida desde aquí. Y el sur dice que está en bajada desde aquí. Y el este y el oeste dicen que está en lateral desde aquí. Así que todos acuerdan, tomemos un paso hacia el norte. Y sigues haciendo esto de manera iterativa hasta que llegues a un punto en el que todos digan que está en bajada desde aquí.

¿Has encontrado la montaña más alta? No. (...) ¿Qué has hecho? Has encontrado la colina más cercana.

¿Alguna vez encontrarás la montaña más alta? No. Nunca encontrarás la montaña más alta. Estás atrapado. Estás optimizado localmente, pero sub-optimizando globalmente. Y para optimizar globalmente, necesitas un poco de ruido. Necesitas permitir ocasionalmente que este grupo de personas dé un paso contraintuitivo hacia abajo de la montaña o hacia abajo de la colina. Así que, a veces, toman una secuencia por casualidad de una secuencia de pasos hasta que vuelven al plano. Y luego navegan por todo este paisaje de aptitud, explorando todos estos picos hasta que terminan en este pico. [00:11:56] Y este alto pico tiende, el óptimo global, tiende a ser un estado receptor porque se necesita mucho más ruido para salir de ese pico que de los otros picos. Y ahora oscilas alrededor del óptimo global. Así que, en nuestro trabajo, hemos estado explorando este tipo de programación simple insertada en sistemas sociales para ver si podemos mejorar el rendimiento de los seres humanos al abordar diversos tipos de problemas de acción colectiva.

Ahora, otro problema de acción colectiva involucra un desafío diferente, que es la cooperación, no la coordinación. Los humanos a menudo tienen que cooperar para producir lo que se conoce como un bien público. Y un faro es uno de los ejemplos canónicos de un bien público. El bien público tiene dos características canónicas. Primero que nada, se llama no excluible. Y eso significa que otras personas no pueden ser prevenidas de usarlo. Si construyes un faro para tu propio beneficio, porque estás navegando en los mares y no quieres chocar contra la costa, eso está bien para ti, pero no puedes detener a nadie más de usarlo, ¿de acuerdo? No excluible. [00:12:58] Y también, es no rivalizante. Eso significa que el consumo por una persona no reduce el consumo por otros. Si uso la luz de mi faro, no hay menos luz para que tú la uses. Y esto es diferente, por ejemplo, de un pedazo de pastel. Si tengo un pedazo de pastel, es mío, ¿verdad? Puedo evitar que lo comas. Y si me lo como, no hay ninguno disponible para ti, ¿de acuerdo? Así que el bien público tiene estas características, y son estas características las que a su vez hacen que sea muy difícil producir bienes públicos. Porque cuando se trata de construir un faro, es muy tentador poner tus intereses individuales en contra de los grupos. Si no contribuyes a la construcción del faro, aún puedes beneficiarte de él. Y así todos están tentados a no hacer nada, y entonces el faro no se construye en detrimento de todos. Y también vale la pena enfatizar que los bienes públicos son útiles, porque realmente puedes producir cosas con ellos, como un viaje seguro por mar. Y como tal, la subinversión en bienes públicos es un problema serio en nuestra sociedad, y también se ha conocido como la tragedia de los bienes comunes. Estos bienes públicos, por ejemplo, las normas de confianza que mantenemos entre nosotros son eficientes. [00:14:01] Piensa en cuando estabas en la escuela secundaria. Algunos de ustedes fueron a una escuela secundaria donde los estudiantes confiaban unos en otros, y eso significaba que podías dejar tus mochilas solas en el pasillo y no preocuparte de que alguien las robara. Otros de ustedes fueron a escuelas secundarias donde no había las mismas normas de confianza, y ahora tenías que asegurar tu mochila o mantenerla contigo en todo momento. ¿En cuál de esos dos entornos crees que tendrías un mejor aprendizaje? ¿Verdad? En el primer entorno. Entonces, esa norma que se mantiene colectivamente es productiva. En ese caso, productiva para el aprendizaje. Aquí, productiva para un viaje seguro por mar y así sucesivamente.

La cooperación en grupos humanos para producir bienes públicos es un desafío, y se requieren varios mecanismos para sostenerla. Hemos realizado muchos experimentos que implican colocar humanos en grupos de red y pedirles que jueguen diversos tipos de juegos de bienes públicos con sus vecinos, manipulando muchas características estructurales y otras a lo largo de los años. Por ejemplo, comenzamos hace años con un experimento en el que las personas eran colocadas en una red como esta. Se les presentó a sus vecinos y jugaron un juego de bienes públicos, como en la economía del comportamiento, [00:15:03], donde, por ejemplo, podría dar un poco de dinero a cada uno de mis vecinos. Tomo un dólar y lo divido entre mis vecinos. Luego, los científicos duplican el dólar. Supongamos que tengo cuatro vecinos. Supongamos que tengo tres vecinos, y doy un dólar al grupo. Se convierte en dos dólares. Esos dos dólares se dividen entre los cuatro de nosotros. Entonces, todo el grupo gana riqueza a dos dólares, pero yo solo recupero 50 centavos. Los dos divididos por cuatro, recupero 50 centavos. Así que tengo que hacer un sacrificio para el beneficio de los demás. Naturalmente, todos dicen: no quiero sacrificarme. Que cada otro tonto dé el dinero. No voy a dar nada, y espero que otros contribuyan. Pero, por supuesto, si todos hacen eso, terminamos en un colapso nuevamente. Y el mejor comportamiento es si todos contribuyen al máximo. Así que aquí en esta situación, comenzamos el juego. Los puntos azules son las personas azules, que son las personas cooperativas y amables. Dan al máximo a sus vecinos y están creando bienes públicos, como construir el faro. Y los puntos rojos son los explotadores que no hacen contribuciones, lo que también se conoce como los defectores. Y lo que encontramos en este experimento es que reproducimos un resultado que se conoce desde hace 30 años, [00:16:03], que es que la cooperación colapsa en grupos. Al final del juego, múltiples rondas después, prácticamente todos se convierten en defectores, excepto estos pequeños puntos azules aquí a un lado, manteniendo viva la civilización, entre ellos. También puedes pensar en, otra vez, para evocar la escuela secundaria para los estudiantes de pregrado. Recuerda esa situación en la que tu profesor de ciencias asignó a cuatro de ustedes hacer un proyecto grupal, y ustedes iban a recibir la misma nota. Y te asignaron a tres perdedores más. Así que ahora tienes dos opciones. O haces todo el trabajo y ellos también obtienen A porque quieres un A. O dices, eso es ridículo. No quiero que estos chicos perezosos se beneficien de mi arduo trabajo. Y dices, no voy a hacer nada tampoco, y todos obtienen F, ¿verdad? Ese es un dilema terrible. Bueno, lo que sucede aquí es que los seres humanos finalmente eligen la última opción. Todos eligen obtener F porque no quieren ser tontos y seguir contribuyendo. Así que la cooperación colapsa en los sistemas sociales como resultado general. Pero lo que hicimos fue, una vez más, agregar algún tipo de bots, aunque diferentes, al sistema. Agregamos algunos bots que estaban dotados de una A muy simple. [00:17:05] Y estos bots eran como pequeños mediadores de matrimonio. Mediaban interacciones sociales. Miraban a su alrededor localmente quién estaba interactuando con quién, y daban sugerencias a las personas en el sistema. Sabes qué, deberías cortar el lazo con ese defector que se está aprovechando de ti y formar un lazo con este chico amable aquí en su lugar. Y este gentil consejo de reconfiguración que solo utiliza conocimiento local. No hay un maestro ahí ordenando a las personas que sean amables. No hay policía. No hay tribunal. No hay autoridad centralizada que ejecute esto. Simplemente actuando sobre el conocimiento local, descubrimos que estos bots podían, en nuestros experimentos con más de 1,000 personas en 64 grupos, no solo estabilizar la cooperación, sino que, por primera vez, demostramos un resultado que la cooperación podría, de hecho, aumentar desde la línea base cuando se añadieron estos tipos de bots. Y DeepMind posteriormente replicó nuestros resultados y los extendió en otro artículo que apareció aproximadamente un año o dos después de este.

Ahora, en otro experimento, exploramos cómo los bots podrían afectar la creatividad grupal. [00:18:07] porque encontrar nuevas ideas es difícil. Y la teoría y los experimentos sugieren que los grupos pueden ser mejores para identificar y preservar innovaciones que los individuos al compartir sus descubrimientos.

Pero la innovación dentro de los grupos enfrenta sus propios desafíos, incluido el pensamiento grupal. ¿Verdad? Si reúnes a un grupo de personas, pueden converger prematuramente en una idea subóptima.

O podrías imaginar, deberías imaginar, que un grupo de personas podría tener colectivamente más sabiduría, podría ser capaz de generar más ideas. Por ejemplo, si le das a un grupo de personas la tarea de perfeccionar una caña de pescar, ya sabes, la primera persona podría decir, bueno, ¿por qué no ponemos un anzuelo al final de un hilo? Y luego la persona sostiene el hilo con un anzuelo. Y alguien dice, ¿por qué no ponemos un palo añadido al hilo? Oh, eso es una gran idea. Así que combinan su conocimiento y lo hacen. Y alguien dice, bueno, el cebo con el anzuelo está flotando en la superficie. Vamos a añadir una boya para que se hunda. Bueno, ahora se hunde demasiado. ¿Qué tal si añadimos una boya para saber dónde está y así sucesivamente? Y así la gente innova, comparte conocimiento entre ellos, preserva el conocimiento a lo largo del tiempo, [00:19:08] y obtienes estos artefactos culturales que son el producto compuesto de varias personas compartiendo ideas y siendo creativas.

Entonces queríamos crear un juego en el que grupos de personas buscaran en un paisaje una idea óptima. Y decidimos usar sustantivos como una representación de ideas. Tomamos 20,000 sustantivos del corpus clásico de ciencia de la computación word-to-vec. Así que tomamos 20,000 sustantivos. Y la distancia entre estos sustantivos podría definirse por la métrica de similitud coseno. Puedes imaginar un espacio vectorial hiperdimensional en el que gato es más similar a perro que a escritorio. Y la manera en que hicieron eso fue mirando con qué frecuencia las palabras gato y perro coaparecían en sitios web. Así que tenían un universo de sitios web y un universo de 20,000 sustantivos. Y dijeron que estos dos sustantivos coaparecen a menudo y que estos otros dos sustantivos no coaparecen a menudo. Crearon un espacio vectorial de 300 dimensiones. [00:20:08] Y ahora puedes describir cuán similares son cualquier par de sustantivos. Y decidimos usar sustantivos como una representación de ideas. Tomamos estos 20,000 sustantivos. Y luego seleccionamos un conjunto de sustantivos. Imagina que seleccionamos un sustantivo, pero elegimos un conjunto. Un sustantivo al azar de todos estos, como bragado, por ejemplo, fue un sustantivo. Así que elegimos bragado. Y decimos que esa es la idea perfecta que queremos que este grupo de personas encuentre. Y luego todos los sustantivos que están cerca de bragado caen en este espacio vectorial. Así que tienes el sustantivo cumbre que recibe más puntos, 20,000 puntos, y todos los otros sustantivos hasta los sustantivos más lejanos. Y ponemos humanos en este sistema y decimos, encuentra esta palabra. No les decimos la palabra. Y luego les decimos el valor en puntos de las palabras. Entonces empiezan a adivinar. Y a medida que adivinan, obtienen retroalimentación. Y dicen, ah, esta palabra tiene más puntos que otra palabra. Y se acercan cada vez más y comienzan a compartir el conocimiento entre ellos. Están tratando de ser creativos para resolver el problema.

Así que cada sustantivo está relacionado con otros en un espacio semántico o un paisaje sin rumbo. [00:21:10] Y teníamos 18 sustantivos objetivo diferentes, como si hubiéramos levantado un pico del paisaje de estos 20,000 sustantivos en 18 ubicaciones diferentes en 18 paisajes diferentes. Y estos sustantivos eran deliberadamente inusuales, como fratricidio, palanca, sarcoma, cartografía, y así sucesivamente. Y luego realizamos experimentos que involucraban varias condiciones donde las personas estaban solas tratando de navegar por el paisaje, donde las personas estaban en grupos trabajando juntas para navegar por el paisaje, o donde las personas estaban en grupos pero también había algunos bots tratando de ayudarles a ser creativos. Y los bots funcionaron porque podían pasar información de una región de la red a otra comunicándose entre sí. Así que, por ejemplo, el bot número dos podía pasar la palabra cielo o coche al bot número uno. Así que aquí hay un ejemplo de red.

Dejamos entrar a las personas. Los puntos cuadrados son bots. Y este bot tiene cuatro interacciones y este bot tiene, no sé, seis o siete interacciones. Los seres humanos al principio empiezan a adivinar. [00:22:12] No tienen ninguna base para adivinar en absoluto en la primera ronda del juego. Adivinan cielo, coche, conejo, rata, perro, gato, escritorio. Como si les pidiera a ustedes, elijan un sustantivo para adivinar, adivinarían casa o sol o luna o gato o perro o algún sustantivo típico pequeño. Y ahora se les dice el valor de los puntos, como cuán similar es la palabra rata, perro, gato, escritorio, etc., a sarcoma. Y se les dice el valor de los puntos de esos sustantivos en relación con el sustantivo objetivo, que es sarcoma. Luego se anuncian esos valores de puntos. Y luego este bot puede mirar los valores de puntos de los humanos a su alrededor y puede transmitir ya sea una elección aleatoria a este bot o el valor más alto de puntos o el más bajo, una especie de canal de comunicación alterno que difunde información de una región de un grupo de personas tratando de resolver el problema a otra región. Así que veamos algunos ejemplos para aclarar esto, porque puede ser difícil de entender. Las personas jugaron este juego durante aproximadamente 25 rondas. Y aquí está la similitud del coseno con un sustantivo objetivo, que es la palabra fratricidio. Bien, hay 20,000 sustantivos. [00:23:13] El fratricidio tiene 20,000 puntos. Y las otras palabras tienen otros puntos. Y aquí hay una persona sola, una persona por sí misma que está adivinando. Así que su primera adivinanza es bit. Y se les dice cuán similar es la palabra bit a fratricidio. Y luego su siguiente adivinanza es nacimiento. Y obtienen un gran aumento en la similitud de coseno, porque se puede imaginar que la palabra nacimiento está más cerca de la palabra fratricidio que la palabra bit. ¿De acuerdo? Y luego adivinan. Intentan dinero a continuación. Eso es peor. Luego intentan mono. Eso es aún peor. Verifican. Hacen una verificación de cordura. Intentan nacimiento. Vuelve a aumentar. Luego intentan bebé. Esa no es una mala adivinanza. Nacimiento a bebé. Pero bebé los aleja más de fratricidio. Y luego dama y así sucesivamente. Y navegan. Y están adivinando. Y están adivinando. Y están adivinando. Y no se acercan en absoluto a fratricidio al final. Ahora en esta otra situación, tenemos un grupo de personas, pero sin bots. Y ahora las personas pueden, además de hacer sus propias adivinanzas, ver las adivinanzas de las personas a su alrededor. Y construir sobre las ideas de otros. ¿De acuerdo? Creado. Como hacer la caña de pescar juntos. [00:24:13] Así que esta persona, su primera adivinanza es perro. Pero su siguiente adivinanza es escudo. Se puede ver que escudo está más cerca de fratricidio que perro. Y esta persona está adivinando y adivinando y recibiendo comentarios de sus vecinos. Y al final, se acerca más y más. Termina con la palabra enemigo. ¿De acuerdo? En realidad, soldado fue su mejor adivinanza. Tenía el valor de puntos más alto durante su trayectoria.

Entonces, ¿cómo importa la adición de los bots? Esto, una vez más, muestra el resumen de los resultados. En el eje X está la ronda. En el eje Y está la similitud coseno media en este espacio vectorial hiperdimensional, que es una medida del rendimiento grupal. Y aquí hay un grupo de humanos que están actuando, adivinando en solitario. Así que los humanos que están adivinando por su cuenta no lo hacen muy bien, ¿verdad? Es solo cuestión de suerte si pueden, o, ya sabes, alguna habilidad innata en cada humano individual. Se vuelven un poco mejores con el tiempo, acercándose. Todos los grupos superan al solitario. Y este es un antiguo resultado conocido. Un grupo de personas es más creativo que un conjunto similar en tamaño de practicantes solitarios. Pero lo que encontramos es que si añadimos el bot más similar, el bot que miró a sus vecinos, [00:25:17] y encontró, ¿cuál es su consenso local sobre esto? Mis humanos parecen pensar que esta es una buena palabra. Y luego lo pasa al bot en una parte distante de la red. Ese bot mejoró sustancialmente el rendimiento de este grupo de personas para hacer un descubrimiento. Deberías poder imaginar cómo esto podría funcionar en un grupo de ingenieros o cualquier otro trabajador del conocimiento. Cómo, como puedes distribuir el conocimiento de manera eficiente, evitando el pensamiento grupal y fomentando la creatividad, diseñando bots que ayuden a los humanos a ayudarse a sí mismos. El bot aquí no tiene cerebro. No está sugiriendo ideas por sí mismo. Simplemente está ayudando a los humanos a difundir las ideas entre ellos.

Así que agentes de IA simples con un comportamiento interpretable pueden mejorar la capacidad de descubrimiento creativo en grupos humanos al compartir ideas sobre las que hay un consenso local en una parte del grupo con personas en una parte distante del grupo. Y como resultado, el grupo puede desempeñarse mejor.

Ahora, también hemos comenzado a experimentar con sistemas físicos. Y hemos agregado robots humanoides y no humanoides [00:26:19] dotados de inteligencia artificial simple a grupos de humanos cara a cara y mostramos cómo pueden facilitar que los grupos de humanos trabajen juntos al ayudarles a superar la fricción o la incapacidad para cooperar en sus interacciones. Uno de mis ejemplos favoritos de esto es un experimento que hice con mi ex estudiante de posgrado, Maggie Traeger, que está en la parte de atrás y ahora es profesora asistente en Notre Dame. Este experimento. En este experimento, tomamos a tres humanos reales que llegaron al laboratorio y un robot humanoide. Y diseñamos un pequeño juego, un pequeño juego de rieles de tren, que se juega en una tableta, y este grupo de humanos y un robot tenían la tarea de colocar rieles de tren desde el punto A hasta el punto B, como unas pequeñas vías de tren de Thomas el Tren. Y luego les dimos algunas piezas que podían elegir en la tableta, como piezas rectas y curvas. Pero a veces nos las ingeniamos, aunque parecía que había una mezcla de piezas y que en principio deberían poder ir del punto A al punto B, lo diseñamos maliciosamente de tal manera que no había el número correcto de curvas para permitirles ir del punto A al punto B. [00:27:21] Entonces no podían hacerlo. No podían resolver el problema sin que ellos lo supieran. ¿Está bien? Así que primero cada persona tomaría su turno colocando una pieza de riel, luego la siguiente persona y la siguiente persona. Están trabajando juntos para conectar el punto A al punto B en sus tabletas.

Y lo que hicimos en este experimento fue manipular, y jugaron 30 rondas de este juego en este mundo virtual, y tuvimos 51 grupos, manipulamos el estilo conversacional de los robots, específicamente si el robot expresaba vulnerabilidad al reconocer un error. Así que el robot dijo, ya saben, cometí un error. O si el robot contaba chistes de papá. Supongo que todos saben lo que son los chistes de papá. Está bien. También tuvimos al robot que dijera, por cierto, eso es un universal cultural, como los antropólogos en la selva amazónica han observado a los pueblos indígenas y los papás allí también cuentan chistes de papá. Y los niños están como, no puedo creer los estúpidos chistes de papá. Pero de todos modos, en realidad hay una teoría sobre lo que los chistes de papá están destinados a endurecer a los niños de alguna manera. Esta es una teoría. Pero de todos modos, ese es otro tema. En fin, nuestros robots contaron chistes de papá o expresaron vulnerabilidad. [00:28:21] Y lo que nos interesaba descubrir es si los cambios en el habla de los robots tenían el poder de afectar no solo cómo las personas interactúan con los robots, sino también cómo las personas interactúan entre ellas. Y una vez más, esto ofrece la perspectiva de modificar las interacciones sociales mediante la introducción de agentes artificiales en sistemas híbridos de humanos y máquinas.

Aquí hay un pequeño ejemplo de, oh, y no te conté los resultados. Así que aquí están, aquí es cuando tenemos, así que estos, el grosor de estas líneas, configuramos cámaras de video para monitorear quién está hablando con quién y cuánto están hablando. Y el grosor de estas líneas indica cuánto habla la persona dos con la persona uno y viceversa. Así que la persona uno no habla mucho con el robot. Esa es una línea delgada. Y cuando tenías robots neutrales, obtienes este patrón. Pero cuando tenías el robot vulnerable, todas estas líneas se engrosan y se igualan. Así que descubrimos que un robot vulnerable aumentaba la igualdad de discurso entre los humanos, aumentaba el volumen de discurso entre los humanos, y de hecho, en resultados separados, [00:29:22] aumentaba la satisfacción de los humanos en ese tipo de entorno.

Y aquí hay un clip de dos rondas diferentes que ilustran cómo el robot habla de manera neutral primero, en voz pasiva, lo que no afecta mucho la comunicación humana. El robot dice, de una manera muy regresiva, se cometió un error.

Pero en la siguiente ronda, el robot dice, cometí un error. Y puedes ver lo que sucede aquí. Veamos si podemos hacer que esto funcione. (25 segundos de pausa) Así que a través de muchas, muchas docenas de ejecuciones, este es el tipo de patrón que encontramos. Así que una manipulación simple, una manipulación simple en el patrón de habla del robot cambia cómo los humanos interactúan entre sí. [00:30:25] Y no, asumo, no toma mucho imaginar cómo toda la manera en que diseñamos nuestros chatbots y otras cosas podría estar afectando no solo el ejemplo de Alexa que te di al principio, cómo nos tratamos entre nosotros. Los humanos parecen confiar más entre sí y tener más diversión en esta situación.

Ahora aquí hay silencio, y creo que este es el último experimento que voy a mostrarte y luego concluiré, en otro experimento más, desarrollamos una plataforma cibernética-física novedosa para probar tales efectos sociales y, de hecho, éticos de tipos simples de IA. Porque dada la naturaleza de los problemas de acción colectiva, la participación de la IA en grupos humanos podría paradójicamente e involuntariamente suprimir normas sociales beneficiosas existentes en los humanos, tales como aquellas que implican cooperación y altruismo que hemos evolucionado como especie. Así que tenemos cientos de miles de años de selección natural que han trabajado en nosotros para hacernos capaces de resolver problemas de acción colectiva. Entonces la pregunta es, bueno, si delegamos parte de esa agencia a las máquinas, ¿perderemos la capacidad de trabajar juntos para resolver esos problemas? [00:31:32] ¿Llegaremos a depender de estas máquinas, y así degradamos nuestra habilidad innata para cooperar, coordinar y crear, y así sucesivamente? Entonces, en este experimento, colaborando con Hiro Shirato en CMU, otro ex estudiante graduado mío, construimos una plataforma que involucraba dos pequeños vehículos mecánicos dotados de Raspberry Pi, y lo conectamos a un software que tenemos que nos permite organizar experimentos en línea a gran escala. Así que la gente estaba en sus propias casas, y se les asignó uno de estos coches, y estaban conduciendo estos coches uno hacia el otro,

y los hicimos jugar al juego del gallo. Así que en gallo, sabes, como, quien llega al otro lado más rápido gana. Así que estás incentivado a no ceder ante el otro. Pero si cada uno de ustedes decide no ceder, entonces chocan, y ambos obtienen el peor resultado. Entonces, lo que harían los humanos en esta situación, si están jugando un juego de gallo iterado, es que aprenderían rápidamente a turnarse. Esta vez es tu turno de ir en línea recta, yo me haré a un lado y te dejaré pasar, pero la próxima vez tú te harás a un lado y me dejarás pasar a mí. [00:32:35] Si somos egoístas, simplemente seguimos chocando entre nosotros, destruyéndonos una y otra vez, o estúpidamente, ambos nos desviamos, y ninguno obtiene el beneficio de ir en línea recta. Así que en esta situación aquí, el coche amarillo decide hacerse a un lado, el coche azul simplemente avanza sin obstáculos todo el camino hacia el otro lado.

Y utilizamos 300 participantes y 150 díadas, y se les pagó en función de qué tan rápido llegarán al otro lado. Luego agregamos un poco de IA. Añadimos asistencia de frenado automático, donde cuando tenías una alerta de proximidad, al acercarte al otro coche, frenaba y te daba la oportunidad de decidir, oye, debería apartarme y dejar pasar a este otro, o viceversa. O añadimos asistencia de dirección automática, que es, en el momento en que se acercaba al otro coche, simplemente se desviaba, ¿de acuerdo? Y añadimos una función de comunicación mínima, donde las personas podían decir gracias, o algo así. Solo una comunicación muy mínima. Y primero, mostramos que la asistencia de frenado automático, donde los coches se detienen a una distancia fija antes de chocar, aumentó el altruismo humano. [00:33:38] Es decir, ceder el paso a otros, como lo hace el coche amarillo aquí. Así que añadir un poco de IA de asistencia de frenado automático facilitó que los seres humanos trabajaran juntos y cooperaran en la situación. Además, permitir que los humanos se comunicaran ayuda aún más a hacer concesiones mutuas en la condición de frenado automático. Por otro lado, la asistencia de dirección automática, donde el coche simplemente se desvió, inhibió completamente la aparición de reciprocidad entre las personas en favor de la maximización del interés propio. Las personas simplemente renuncian a su agencia moral. No se preocupan más. Simplemente dejan que la máquina se desvíe repetidamente, y se rinden, ¿de acuerdo? Así que todas las habilidades éticas innatas que las personas tenían han sido eliminadas por la adición de IA en la condición de dirección automática, pero mejoradas en la condición de frenado automático. Y esto también debería hacerte reflexionar. Deberías estar pensando, oh Dios mío, cada pequeño detalle que hacemos cuando programamos estos agentes de IA podría tener efectos positivos o negativos en las tendencias naturales de las personas.

La capacidad de las personas para cooperar, turnarse y actuar altruistamente puede atrofiarse, lo que lleva a peores resultados colectivos e individuales al final. [00:34:46] De hecho, en resumen, la IA puede llevar a una especie de pereza moral. (..) Aquí hay un último ejemplo de cambio duradero después de la exposición a la IA en sistemas híbridos. Y también es un ejemplo de cómo la presencia de la IA puede cambiar las interacciones humano-humano, incluso después de que la IA ya no sea parte de las interacciones. Entonces, en 2016, DeepMind desarrolló AlphaGo, y en ese mismo año, este agente de IA jugó contra Lee Sedol, el notable campeón mundial de Corea.

Vi el partido. No puedo jugar Go, pero reconozco que es un juego magnífico. Mi hijo juega Go. (.) Y realmente estaba animando a Lee Sedol. Lee Sedol es como un héroe en Corea, como los grandes atletas que tendríamos en nuestras cajas de Wheaties y cosas así. Como, el suyo está en pequeños paquetes de fideos y en paquetes de cereales. Como, creo que es magnífico que en Corea un nerd inteligente como yo sea visto como una persona importante, ¿verdad? Así que es muy popular en Corea. Y sale para el primer partido, y es demasiado arrogante. [00:35:47] Puedo decir que es demasiado arrogante. Y pierde contra la máquina, y luego se disculpa con sus fanáticos. Dice, lo siento mucho. Son cinco juegos. Es el mejor de tres de cinco. Luego juega un segundo juego y vuelve a perder. Y ahora se está poniendo serio. Luego juega un tercer juego y pierde. Ha perdido la competencia.

Y podrías ver a la audiencia, y los comentaristas estaban asombrados por la capacidad de la máquina para jugar Go, haciendo estos movimientos extraños y hermosos, algunos de los cuales luego descubrieron que se habían jugado porque tenemos registros que se remontan a miles de años de partidos de Go jugados en la Corte Imperial China. Y podían encontrar, oh, Dios mío, este es un movimiento medieval que hizo la máquina. No lo habíamos visto en tanto tiempo.

Y luego Lisa Dahl vuelve en el cuarto juego, y él gana. (..) Y lloré. Estaba tan feliz. (..) Porque tenía la máquina, sabes, había vuelto por mi especie y había vencido a la maldita máquina. Como, de manera heroica, como, no podía entender, como, el poder cerebral que debió haber sido necesario para que Lisa Dahl hiciera eso. [00:36:49] Estaba extasiado en ese momento, y tan orgulloso de él por seguir intentándolo, incluso después de haber perdido el partido.

Ahora, lo interesante es que cuando Lisa Dahl fue entrevistada después, dijo que su propio estilo de juego cambió después del partido. Así que una vez más, la IA está ayudando a los humanos a ayudarse a sí mismos, ¿de acuerdo? Él cambia cómo juega debido al contacto. Y las investigaciones posteriores de otros científicos analizaron a jugadores profesionales de Go y observaron la calidad de decisión mediana. Hay ciertos estándares en Go para evaluar qué tan buena es una jugada, y la novedad mediana, como qué tan inusual es una jugada. Y descubren que cuando AlphaGo derrota al campeón mundial humano en 2016, alrededor del mundo, los jugadores de Go comienzan a hacer mejores movimientos que son más innovadores, ¿de acuerdo? Así que todos los humanos que juegan Go entre sí han cambiado porque se ha añadido AlphaGo. La IA ayuda a los humanos a ayudarse a sí mismos. Así que seguimos construyendo sobre nuestro trabajo para diseñar y añadir bots simples a estas y otras situaciones que involucran dilemas sociales y problemas de acción colectiva. [00:37:55] Estamos investigando cómo los bots pueden afectar la coordinación, la cooperación, la comunicación, la creatividad, la confianza, la navegación, el compartir y la evacuación. Y en nuestro laboratorio, no estamos enfocados en una IA superinteligente, como LLMs o AlphaGo, para reemplazar la cognición humana, sino más bien en una IA simple para complementar la interacción humana. No estamos tratando de inventar una IA superinteligente para reemplazar la cognición humana. Estamos inventando una IA simple para complementar la interacción humana. Y nuestra IA puede permitirse ser simple porque los humanos son inteligentes. Nuestra IA es como el platino añadido a una reacción de química orgánica. Es solo un catalizador. Todo lo que necesitamos es el catalizador para ayudar a un grupo de personas a ser mejor.

Y, por supuesto, es importante reconocer que lo inverso también es posible. La IA social puede usarse para dañar a grupos de personas. Pero nuestro enfoque ofrece una serie de otras ventajas técnicas y conceptuales. En primer lugar, estos bots simples son comprensibles y, por lo tanto, ilustran claramente poderes y oportunidades más amplias. A diferencia de los LLMs, que son una caja negra y no sabes lo que están haciendo, puedo decirte exactamente lo que nuestro bot está haciendo. [00:38:58] Es ruidoso. Está facilitando presentaciones. Está pasando mensajes de esta manera muy específica. Y en segundo lugar, nuestros experimentos controlados con bots también pueden proporcionar información sobre cómo el comportamiento humano también podría cambiar de manera beneficiosa. En otras palabras, puedo llevar esto del laboratorio y puedo enseñar a un grupo de humanos a hacer lo que hicieron nuestros bots. De alguna manera, no puedes enseñar fácilmente a un grupo de humanos a hacer simplemente lo que ChachiPT hizo aquí. No sabemos lo que ChachiPT está haciendo, pero sabes lo que están haciendo en nuestra situación.

Así que me gustaría cerrar, esta es mi última diapositiva, con una metáfora. Considera estos dos objetos. Ambos están hechos de carbono. Si tomas los átomos de carbono y los conectas de una manera, obtienes grafito, que es suave y oscuro. Toma los mismos átomos de carbono y conéctalos de otra manera, obtienes diamante, que es duro y claro. Y hay dos ideas intelectuales clave aquí. En primer lugar, estas propiedades de suavidad y oscuridad y dureza y claridad no son propiedades de los átomos de carbono. Son propiedades de la colección de átomos de carbono. Y en segundo lugar, qué propiedades obtienes depende de cómo conectas los átomos de carbono entre sí. Toma los mismos átomos de carbono y conéctalos de una manera, obtienes un conjunto de propiedades. [00:40:01] Conéctalos de otra manera, obtienes un conjunto completamente diferente de propiedades. De manera similar, la naturaleza de nuestras conexiones afecta las propiedades de nuestros grupos sociales. Son los lazos entre las personas los que pueden hacer que el todo sea mayor que la suma de sus partes. Pueden surgir y expandirse nuevas propiedades, como la cooperación y la violencia, la innovación y la productividad, la confianza y la desconfianza, la verdad y la falsedad, la riqueza y la pobreza, la salud y la felicidad, debido a las conexiones, debido a los lazos entre las personas, y no necesariamente solo a causa de las personas mismas. De hecho, nuestra experiencia del mundo depende de la estructura y la función de las redes que nos rodean, cerca y lejos. Y nuestra especie evolucionó para que esto fuera así. Y no debería sorprendernos que respondamos a la IA en medio de nosotros. Muchas gracias.

Entradas Similares