Nicholas Christakis : [00:00:05] Très bien, donc les êtres humains sont intégrés dans des réseaux sociaux, et ces réseaux obéissent à des principes mathématiques, biologiques et sociaux très particuliers. Et de plus en plus, nous ajoutons de l'intelligence artificielle sous forme d'agents en ligne et de robots physiques parmi nous qui interagissent avec nous comme s'ils étaient des entités sociales. Et ces types d'agents que nous allons ajouter à nos systèmes vont des voitures sans conducteur sur les routes aux machines de caisse dans les magasins, en passant par des robots humanoïdes à domicile ou dans des usines ou sur des champs de bataille ou dans des situations de lutte contre les incendies, jusqu'à des agents autonomes désincarnés tels que des bots en ligne et des assistants numériques d'IA dans nos téléphones ou nos lunettes ou nos lieux de travail. Et ces technologies interagissent avec nous sur un terrain d'égalité comme si elles étaient humaines. Et elles donneront lieu à des systèmes hybrides d'êtres humains et de machines. Et ces systèmes offrent des opportunités pour un nouveau type d'intelligence artificielle sociale.
Maintenant, laissez-moi vous donner un simple exemple de cela. Lorsque vous obtenez, par exemple, un assistant numérique, comme un Alexa, le fabricant de cet appareil est très préoccupé par l'interaction homme-machine. Et cette interaction homme-machine est optimisée. Par exemple, vous ne voudriez jamais acheter l'Alexa si chaque fois que vous aviez besoin de quelque chose, vous deviez dire : excusez-moi, Alexa, je suis vraiment désolé de vous interrompre. Si cela ne vous dérange pas, pourriez-vous s'il vous plaît me dire le mot ? [00:01:35] météo de demain, n'est-ce pas ? Cela serait considéré comme un niveau d'affabilité absurde. Vous vous attendez à pouvoir dire, Alexa, météo, et ensuite la machine répond obéissamment. Et cela va bien jusqu'à ce que vous introduisiez cette machine dans votre maison et que vos enfants parlent à cette machine et apprennent à être impolis. Et ensuite ils vont au terrain de jeu et ils sont impolis avec les autres enfants. Donc, cette machine qui a été ajoutée parmi nous, ce n'est pas seulement une question d'interaction homme-machine, c'est une question d'interaction homme-homme en présence de machines. Et donc, ce qui m'intéresse, ce n'est pas, c'est les interactions homme-homme en présence de machines. Et nous pouvons utiliser une compréhension de la structure et de la fonction du réseau social pour évaluer les usages et l'impact de l'IA sociale au sein et sur les groupes humains, en rapport avec des facteurs tels que la confiance et la coopération qui sont nécessaires pour que des groupes de personnes travaillent ensemble, euh, et qui affectent le comportement de ces collectivités.
Alors laissez-moi souligner certains des travaux que nous réalisons, euh, en utilisant plusieurs approches pour des expériences en réseau impliquant, euh, l'intelligence artificielle. Ces expériences évaluent comment l'IA pourrait affecter la structure et le fonctionnement des interactions sociales humaines. [00:02:45] Maintenant, il existe une catégorie de problèmes d'action collective des interactions sociales que nous appelons des problèmes de coordination. C'est-à-dire que ce sont des problèmes pour lesquels nous devons travailler ensemble si nous voulons créer quelque chose d'utile. Et parfois, nous résolvons ces problèmes en créant des institutions centralisées comme la police ou les tribunaux ou les gouvernements. Mais souvent, nous sommes capables de résoudre des problèmes d'action collective qui nécessitent que nous coordonnions ou coopérions avec un grand nombre de personnes de manière décentralisée. Nous avons en fait évolué pour avoir cette capacité. Et un type spécifique de problème d'action collective avec lequel j'aimerais commencer aujourd'hui est, en fait, la coordination.
Par exemple, pour éviter cet embouteillage, les gens doivent coordonner pour faire quelque chose de différent de leurs voisins. Donc, si tout le monde quitte sa maison en même temps, tout le monde est coincé dans un embouteillage. Mais si, s'ils décalent leurs heures de départ et qu'ils partent à intervalles, alors personne n'est dans l'embouteillage. Maintenant, bien sûr, vous pourriez avoir une sorte d'autorité centrale qui coordonne cela. Vous partez en premier, puis vous, et ensuite vous. [00:03:45] Mais idéalement, ce que vous voudriez, c'est une sorte de façon décentralisée et non hiérarchique pour que les êtres humains se coordonnent afin de résoudre ce problème.
Voici donc notre première expérience publiée en 2017 sur de tels systèmes hybrides qui exploraient comment l'IA pourrait aider face à un tel défi. Nous avons étudié la performance de groupes humains engagés dans une tâche de coordination. Notre paradigme était d'emprunter quelque chose connu en informatique, appelé le problème de coloration de graphe. C'est un problème classique en informatique. Mais ce que nous avons fait, c'est que nous l'avons adapté en mettant des êtres humains dans cette situation. Nous avons donc pris 4 000 personnes et les avons réparties en 230 groupes en ligne. Ces êtres humains ont été placés dans ces groupes. Ils ont été assignés aléatoirement à un endroit au sein d'un réseau artificiel que nous avons créé, dont la structure ressemblait grossièrement à celle des véritables réseaux humains. Ils ont été placés à ces endroits et on leur a dit qu'ils avaient été assignés à l'une de trois couleurs, [00:04:46] un violet, un orange, un violet, un orange, et un rose. Ils ont été informés qu'ils devaient choisir une couleur différente de celle de leurs voisins.
Et ils ont eu cinq minutes pour le faire. Ainsi, ces personnes regardaient autour d'elles à leurs voisins. Chaque personne regardait autour et disait, par exemple, ce gars ici est rose. Il voit qu'il a un voisin rose et un voisin orange. Ce qu'il devrait faire, c'est changer pour la couleur violet. Et les lignes rouges ici indiquent des conflits de couleur. En d'autres termes, si les deux couleurs des nœuds adjacents sont les mêmes, ils reçoivent une ligne rouge. Et les lignes de fond violet indiquent la structure des interactions sociales. Donc, vous mettez les gens ici. Ils regardent autour d'eux à leurs voisins chaque seconde ou seconde et demie. Ils font un changement conforme à l'objectif que tous doivent choisir une couleur différente de celle de leurs voisins au cours des cinq prochaines minutes. Et s'ils le font, alors, et seulement alors, ils seront payés. Je vais vous payer pour travailler ensemble. Et si vous travaillez tous ensemble de manière décentralisée pour résoudre le problème, vous serez tous payés. Sinon, vous ne recevrez rien, d'accord ? Alors voici ce qui se passe dans cette expérience. Ici, sur l'axe des x, le temps en secondes jusqu'à la marque des cinq minutes. [00:05:47] Le jeu dure cinq minutes, là-bas quelque part. Et ici, sur l'axe des y, la fonction objective ou le nombre de conflits de couleur. Donc, ici au début, il y a 12 conflits de couleur. Ils sont assignés aléatoirement leurs couleurs initiales. Et cela est montré ici dans ce petit histogramme juste là. Et donc, les gens commencent à regarder autour d'eux et à changer leurs couleurs. Vous savez, ils échangent et ils changent. Et ils arrivent à ce point où ils ont maintenant atteint une situation dans laquelle il y a un conflit de couleur entre ces deux personnes. Et ce conflit, cependant, est ce que nous appelons un conflit irrésoluble. Ainsi, les lignes orange clair sont des conflits résolubles. C'est ce gars ici. Il peut faire un mouvement vers le violet qui résout le conflit. Mais ces gars ici qui sont orange, il n'y a aucun mouvement qu'ils peuvent faire qui réduise le nombre de conflits de couleur dans leur voisinage, n'est-ce pas ? Ce gars ne peut pas changer en violet parce qu'en fait, s'il change en violet, il aura plus de conflits. Il a, comme, quatre voisins violets. Et il ne peut pas changer en rose parce qu'il a deux voisins roses. Donc, il regarde et il dit, eh bien, le moins de conflits que j'ai est de rester orange. Donc maintenant, ce groupe est coincé, n'est-ce pas ? [00:06:49] Ils ont un conflit irrésoluble et rien ne peut se passer. Aucun progrès ne peut être réalisé dans la solution du problème d'action collective jusqu'à ce que l'une de ces deux personnes fasse un mouvement contre-intuitif, change de couleur en violet ou rose, et augmente temporairement les conflits. Et c'est en fait ce qui se passe. Et puis le temps passe, et les êtres humains, à 245 secondes, résolvent le problème. La machine détecte la solution, arrête le jeu, et les paie, d'accord ?
Maintenant, parce que nous étions rusés, ce que nous avons fait, c'est que nous avons réalisé des expériences où nous avons subtilement remplacé certains des êtres humains par des bots. Et nous avons évalué comment l'ajout de bots dotés d'intelligence artificielle pour créer un système hybride a affecté la performance du groupe. Est-il possible d'ajouter des bots aux groupes humains et d'améliorer leur capacité à se coordonner face à un tel défi ? Ce que nous avons fait, c'est que nous avons ajouté trois bots, et nous avons varié deux axes de manière expérimentale. L'endroit où les bots étaient placés, où ils étaient aléatoirement intégrés dans le réseau, s'ils étaient mis au [00:07:51] centre du réseau, ou s'ils étaient placés à la périphérie du réseau. Et nous avons manipulé au hasard leur capacité d'intelligence artificielle ici de manière très triviale et simple. En d'autres termes, nous avons manipulé si les bots agissaient avec perfection ou avec un peu de bruit.
Dans la situation de perfection, toutes les une seconde et demie, les bots regardaient autour d'eux leurs voisins, puis ils choisissaient la couleur qui avait le moins de conflits avec leurs voisins. Ce que vous pourriez considérer comme un comportement irrationnel. Dans la situation avec 10% de bruit, ils faisaient ça, mais 10% du temps, ils choisissaient une couleur au hasard. Et dans la situation avec 30% de bruit, ils faisaient ça, mais 30% du temps, ils choisissaient une couleur au hasard. Donc nous avons rendu les bots, disons, de plus en plus sujets aux erreurs, de plus en plus bruyants.
Et ensuite, nous avons observé, nous avions, je pense, quelque chose comme, commençons par un groupe de contrôle. Nous avons tracé ici sur l'axe x le temps, et ce sont des courbes de survie. Sur l'axe y, c'est la probabilité que le groupe dans son ensemble n'ait pas résolu le jeu de coordination. Donc ici, si vous regardez ici, par exemple, au début, au temps zéro, [00:08:51] 100% des groupes uniquement humains, les sessions avec uniquement des humains, sont en orange. Au début, 100% des groupes uniquement humains n'ont pas résolu le jeu. Et puis, au fil du temps, de plus en plus de groupes humains résolvent le jeu, si bien qu'à la fin des cinq minutes, peut-être 60% des groupes uniquement humains ont résolu le jeu.
Eh bien, ce qui se passe, c'est que si vous mettez 10 % de bots bruyants au centre du réseau, vous obtenez une amélioration de performance discernable. Ici, une proportion nettement plus élevée de groupes de personnes, lorsque les bots qui avaient un peu de bruit ont été ajoutés au milieu, a pu résoudre le problème. En fait, ils ont réduit le temps médian de solution de 232 secondes à 103 secondes. Et il y a d'autres résultats également dans ces données. Les bots parfaits et les bots trop bruyants étaient tous deux inutiles. Vous aviez besoin d'une certaine calibration. Ce sont les 10 % de bots bruyants qui étaient les plus utiles. De plus, la position des bots avait aussi un impact. Mais de manière cruciale, dans ces expériences, nous avons également constaté que les êtres humains qui n'étaient pas connectés aux bots, [00:09:52] qui étaient plus éloignés dans le réseau. Ainsi, dans les graphiques, il y avait des personnes connectées aux bots et d'autres qui ne l'étaient pas. Nous avons découvert que même ces personnes ont commencé à changer leur façon de jouer. Il y avait donc un effet d'entraînement, un effet de cascade. Les avantages de la façon dont le bot interagissait avec ses humains se répercutaient à travers le réseau et commençaient ensuite à affecter les interactions humaines entre elles, toujours plus éloignées dans le réseau. En d'autres termes, les bots ont aidé les humains à s'aider eux-mêmes, et les bénéfices du bruit se sont dispersés au sein de ce système social.
Maintenant, laissons-moi approfondir les idées concernant ce défi collectif et comment ces simples agents d'IA pourraient aider avec une autre analogie. Imaginez que vous avez un plan. C'est un peu comme dans la descente de gradient en apprentissage automatique, par exemple. Vous avez un plan, et vous avez des collines et une montagne. Et vous avez différentes collines, d'accord, de hauteurs différentes. Et vous avez une montagne ici, en haut, qui est la plus haute. Donc, je vais prendre quatre d'entre vous, et je vais vous laisser tomber quelque part ici, et je vais vous lier ensemble, chacun d'entre vous regardant dans une direction cardinale différente, [00:10:54] et je vais vous bandez les yeux. Et je vais vous dire de trouver la montagne la plus haute. Donc, vous discutez entre vous et vous dites, eh bien, pourquoi ne pas chacun faire un pas dans notre direction et rendre compte à l'équipe ? Donc, vous faites un pas vers le nord, et vous dites que c'est en montée d'ici. Et le sud dit que c'est en descente d'ici. Et l'est et l'ouest disent que c'est latéral d'ici. Donc, vous convenez tous de prendre un pas vers le nord. Et vous continuez à faire cela de manière itérative jusqu'à ce que vous atteigniez un point où vous dites tous que c'est en descente d'ici.
Avez-vous trouvé la montagne la plus haute ? Non. (...) Que faites-vous ? Vous avez trouvé la colline la plus proche.
Maintenant, trouverez-vous jamais la plus haute montagne ? Non. Vous ne trouverez jamais la plus haute montagne. Vous êtes bloqué. Vous êtes optimisé localement, mais sous-optimisé globalement. Et pour optimiser globalement, vous avez besoin d'un peu de bruit. Vous devez parfois permettre à ce groupe de personnes de faire un pas contre-intuitif vers le bas de la montagne ou vers le bas de la colline. Ainsi, ils entreprennent parfois par chance une séquence d'étapes jusqu'à ce qu'ils retournent sur le plan. Et ensuite, ils naviguent tout autour de ce paysage d'aptitude, explorant tous ces sommets jusqu'à ce qu'ils se retrouvent sur ce sommet. [00:11:56] Et ce sommet élevé a tendance à être l'optimum global, tend vers un état réceptif parce qu'il faut beaucoup plus de bruit pour s'éloigner de ce sommet que des autres sommets. Et ainsi, vous oscillez maintenant autour de l'optimum global. Donc, dans notre travail, nous avons exploré ce genre de programmation simple insérée dans des systèmes sociaux pour voir si nous pouvons améliorer la performance des êtres humains dans la résolution de divers types de problèmes d'action collective.
Maintenant, un autre problème d'action collective implique un défi différent, qui est la coopération, pas la coordination. Les humains doivent souvent coopérer pour produire ce qu'on appelle un bien public. Et un phare est l'un des exemples canoniques d'un bien public. Le bien public a deux caractéristiques canoniques. Tout d'abord, ce qu'on appelle non-excluable. Cela signifie que d'autres personnes ne peuvent pas être empêchées de l'utiliser. Si vous construisez un phare pour votre propre besoin personnel, parce que vous naviguez en mer et que vous ne voulez pas vous écraser contre la côte, c'est super pour vous, mais vous ne pouvez pas empêcher les autres de l'utiliser, d'accord ? Non-excluable. [00:12:58] Et aussi, c'est non-rival. Cela signifie que la consommation par une personne ne réduit pas la consommation par d'autres. Si je utilise la lumière de mon phare, il n'y a pas moins de lumière pour vous. Et cela est différent, par exemple, d'une part de gâteau. Si j'ai une part de gâteau, c'est à moi, n'est-ce pas ? Je peux vous empêcher de le manger. Et si je le mange, il n'en reste plus pour vous, d'accord ? Donc, le bien public a ces caractéristiques, et c'est ces caractéristiques qui rendent à leur tour très difficile la production de biens publics. Parce que quand il s'agit de construire un phare, il est très tentant de confronter vos intérêts individuels aux intérêts du groupe. Si vous ne contribuez pas à construire le phare, vous pouvez quand même en bénéficier. Et donc, tout le monde est tenté de ne rien faire, et alors le phare ne se construit pas au détriment de tous. Et il est également utile de souligner que les biens publics sont utiles, car vous pouvez en fait produire des choses avec eux, comme un voyage en mer sûr. Et en tant que tel, le sous-investissement dans les biens publics est un problème sérieux dans notre société, et cela a également été connu sous le nom de tragédie des communs. Ces biens publics, par exemple, les normes de confiance que nous maintenons entre nous sont efficaces. [00:14:01] Pensez à lorsque vous étiez au lycée. Certains d'entre vous ont fréquenté un lycée où les étudiants se faisaient confiance, et cela signifiait que vous pouviez laisser vos sacs à dos seuls dans le couloir sans vous inquiéter que quelqu'un les vole. D'autres d'entre vous ont fréquenté des lycées où les normes de confiance n'étaient pas les mêmes, et maintenant, vous deviez verrouiller votre sac à dos ou le garder avec vous en permanence. Dans lequel de ces deux environnements pensez-vous que vous auriez mieux appris ? N'est-ce pas ? Dans le premier environnement. Donc, cette norme qui est collectivement maintenue est productive. Dans ce cas, productive de l'apprentissage. Ici, productif de voyages en mer sûrs, et ainsi de suite.
La coopération dans les groupes humains pour produire des biens publics est difficile, et divers mécanismes sont nécessaires pour la maintenir. Nous avons effectué de nombreuses expériences impliquant de placer des humains dans des groupes en réseau et de leur demander de jouer à divers types de jeux de biens publics avec leurs voisins, manipulant de nombreuses caractéristiques structurelles et autres au fil des ans. Par exemple, nous avons commencé il y a quelques années avec une expérience dans laquelle des personnes étaient mises dans un réseau comme celui-ci. Elles ont été présentées à leurs voisins et ont joué à un jeu de biens publics, comme en économie comportementale, [00:15:03] où, par exemple, je pourrais donner un peu d'argent à chacun de mes voisins. Je prends un dollar et je le divise entre mes voisins. Ensuite, les scientifiques doublent le dollar. Donc, disons que j'ai quatre voisins. Disons que j'ai trois voisins, et je donne un dollar au groupe. Cela devient deux dollars. Ces deux dollars sont répartis entre nous quatre. Donc, tout le groupe accumule une richesse de deux dollars, mais je ne reçois que 50 cents. Les deux dollars divisés par quatre me donnent 50 cents. Je dois faire un sacrifice pour le bénéfice des autres. Naturellement, tout le monde dit, je ne veux pas faire de sacrifice. Que chaque autre imbécile donne de l'argent. Je ne vais rien donner, et j'espère que les autres contribueront. Mais, bien sûr, si tout le monde fait cela, il y a de nouveau un effondrement. Et le meilleur comportement est que tout le monde contribue au maximum. Alors ici, dans cette situation, nous commençons le jeu. Les points bleus, les gens bleus, sont des personnes sympathiques et coopératives. Ils donnent au maximum à leurs voisins, et ils créent des biens publics, comme construire le phare. Et les points rouges sont les exploiteurs qui ne font aucune contribution, aussi connus sous le nom de détracteurs. Et ce que nous découvrons dans cette expérience, c'est que nous reproduisons un résultat connu depuis 30 ans, [00:16:03] à savoir que la coopération s'effondre dans les groupes, n'est-ce pas ? À la fin du jeu, plusieurs tours plus tard, à peu près tout le monde devient un détracteur, sauf ces petits gens bleus ici sur le côté, maintenant la civilisation en vie, vous savez, entre eux. Vous pouvez aussi penser, encore une fois, pour rappeler le lycée aux étudiants de premier cycle. Souvenez-vous de cette situation dans laquelle votre professeur de sciences a assigné quatre d'entre vous à réaliser un projet de groupe, et vous alliez obtenir la même note. Et vous vous retrouvez assigné à trois autres perdants. Donc maintenant, vous avez deux choix. Soit vous faites tout le travail, et ils obtiennent aussi des A parce que vous voulez un A. Soit vous dites, c'est ridicule. Je ne veux pas que ces paresseux profitent de mon dur travail. Et vous dites, je ne vais rien faire non plus, et vous obtenez tous des F, n'est-ce pas ? C'est un terrible dilemme. Eh bien, ce qui se passe ici, c'est que les êtres humains finissent par choisir la dernière option. Ils choisissent tous de recevoir des F parce qu'ils ne veulent pas être des imbéciles et continuer à contribuer. Ainsi, la coopération s'effondre dans les systèmes sociaux en tant que résultat général. Mais ce que nous avons fait, c'est, encore une fois, que nous avons ajouté des bots, bien que d'un type différent, au système. Nous avons ajouté des bots qui étaient dotés d'éléments très simples A. [00:17:05] Et ces bots agissaient comme de petits courtiers matrimoniaux. Ils facilitaient les interactions sociales. Ils observaient autour d'eux qui interagissait avec qui, et ils donnaient des suggestions aux personnes dans le système. Vous savez quoi ? Vous devriez couper le lien avec ce détracteur qui profite de vous et établir un lien avec ce gars sympa ici à la place. Et ce conseil de rétablissement doux qui n'utilise que des connaissances locales. Il n'y a pas de professeur là pour ordonner aux gens d'être gentils. Pas de police. Pas de tribunal. Pas d'autorité centralisée exécutant cela. Juste agir sur des connaissances locales, nous avons découvert que ces bots pouvaient, dans nos expériences avec plus de 1 000 personnes dans 64 groupes, non seulement stabiliser la coopération, mais pour la première fois, nous avons montré un résultat que la coopération pouvait en réalité augmenter par rapport à la base lorsque ces types de bots étaient ajoutés. Et DeepMind a ensuite répliqué nos résultats et les a étendus dans un autre article qui est apparu environ un an ou deux après celui-ci.
Lors d'une autre expérience, nous avons exploré comment les bots pourraient affecter la créativité de groupe. [00:18:07] car trouver de nouvelles idées est difficile. Les théories et les expériences suggèrent que les groupes peuvent mieux identifier et préserver les innovations que les individus en partageant leurs découvertes.
Mais l'innovation au sein des groupes fait face à ses propres défis, y compris le conformisme de groupe. N'est-ce pas ? Si vous réunissez un groupe de personnes, elles peuvent converger prématurément vers une idée sous-optimale.
Ou vous pourriez imaginer, vous devriez imaginer, qu'un groupe de personnes pourrait collectivement avoir plus de sagesse, être capable de proposer plus d'idées. Par exemple, si vous donnez à un groupe de personnes la tâche de perfectionner une canne à pêche, vous savez, la première personne pourrait dire, eh bien, pourquoi ne pas mettre un hameçon au bout d'une corde ? Et ensuite la personne tenant la corde avec un hameçon. Et quelqu'un dit, pourquoi ne pas ajouter un bâton à la corde ? Oh, c'est une excellente idée. Donc, ils combinent leurs connaissances et ils font ça. Et quelqu'un dit, eh bien, l'appât avec l'hameçon flotte à la surface. Ajoutons une onde pour qu'il descende. Eh bien, maintenant ça descend trop loin. Que diriez-vous d'ajouter un flotteur pour savoir où il est, et ainsi de suite. Et donc les gens innovent, partagent leurs connaissances entre eux, préservent les connaissances au fil du temps, [00:19:08] et vous obtenez ces artefacts culturels qui sont le produit composite de plusieurs personnes partageant des idées et étant créatives.
Nous voulions créer un jeu dans lequel des groupes de personnes recherchaient un paysage à la recherche d'une idée optimale. Nous avons décidé d'utiliser des noms comme substituts pour les idées. Nous avons donc pris 20 000 noms du corpus classique de science informatique word-to-vec. Nous avons donc pris 20 000 noms. Et la distance entre ces noms pouvait être définie par la métrique de similarité cosinus. Vous pouvez imaginer un espace vectoriel hyperdimensionnel dans lequel le chat est plus similaire au chien qu'il ne l'est au bureau. Et la façon dont ils ont fait cela est qu'ils ont examiné à quelle fréquence les mots chat et chien coapparaissaient sur les sites Web. Ils avaient un univers de sites Web et un univers de 20 000 noms. Et ils ont dit que ces deux noms coapparaissent souvent et que ces deux autres noms ne coapparaissent pas souvent. Ils ont créé un espace vectoriel de 300 dimensions. [00:20:08] Et maintenant, vous pouvez décrire à quel point deux noms quelconques sont similaires. Nous avons décidé d'utiliser des noms comme substituts pour les idées. Nous avons pris ces 20 000 noms. Puis nous avons choisi un ensemble de noms. Imaginez que nous avons choisi un nom, mais nous avons choisi un ensemble. Un nom au hasard parmi tous ceux-ci, comme braggadocio, par exemple, était un nom. Nous avons donc choisi braggadocio. Et nous disons que c'est l'idée parfaite que nous voulons que ce groupe de personnes trouve. Et puis tous les noms qui sont proches de braggadocio tombent dans cet espace vectoriel. Vous avez le nom phare qui obtient le plus de points, 20 000 points, et tous les autres noms jusqu'aux noms les plus éloignés. Et nous avons placé des êtres humains dans ce système et nous avons dit, trouvez ce mot. Nous ne leur disons pas le mot. Et ensuite, nous leur donnons la valeur des mots. Ils commencent donc à deviner. Et au fur et à mesure qu'ils devinent, ils reçoivent des retours. Et ils disent, ah, ce mot a plus de points qu'un autre mot. Et ils se rapprochent de plus en plus et commencent à partager leurs connaissances entre eux. Ils essaient d'être créatifs pour résoudre le problème.
Ainsi, chaque nom est lié à d'autres dans un espace sémantique ou un paysage sans relief. [00:21:10] Et nous avons eu 18 noms cibles différents, comme si nous avions tiré un sommet du paysage de ces 20 000 noms en 18 emplacements différents dans 18 paysages différents. Et ces noms étaient délibérément inhabituels, comme le fratricide, le chausse-pied, le sarcome, la cartographie, et ainsi de suite. Ensuite, nous avons réalisé des expériences impliquant plusieurs conditions où les gens étaient seuls essayant de naviguer dans le paysage, où les gens étaient en groupes travaillant ensemble pour naviguer dans le paysage, ou où les gens étaient en groupes mais avaient également quelques bots essayant de les aider à être créatifs. Et les bots fonctionnaient parce qu'ils pouvaient transmettre des informations d'une région du réseau à une autre en communiquant entre eux. Par exemple, le bot numéro deux pouvait transmettre le mot ciel ou voiture au bot numéro un. Voici donc un exemple de réseau.
Nous faisons entrer les gens. Les points carrés sont des bots. Et ce bot a quatre interactions et ce bot a, je ne sais pas, six ou sept interactions. Les êtres humains au début commencent à deviner. [00:22:12] Ils n'ont aucune base pour deviner lors du premier tour du jeu. Ils devinent ciel, voiture, lapin, rat, chien, chat, bureau. Comme si je vous demandais, à vous tous, de choisir un nom à deviner, vous devineriez maison ou soleil ou lune ou chat ou chien ou un petit nom typique. Et maintenant, on leur donne la valeur en points, comme à quel point le mot rat, chien, chat, bureau, etc., est similaire au sarcome. Et on leur dit la valeur en points de ces noms par rapport au nom cible, qui est sarcome. Et ensuite, ces valeurs de points leur sont annoncées. Et puis ce bot peut regarder les valeurs de points des humains autour de lui et peut transmettre soit un choix aléatoire à ce bot, soit la valeur de points la plus élevée ou la plus basse, un genre de canal de communication backdoor propagent des informations d'une région d'un groupe de personnes essayant de résoudre le problème à une autre région. Regardons quelques exemples pour essayer de clarifier cela, car cela peut être difficile à comprendre. Les gens ont joué à ce jeu pendant environ 25 tours. Et voici la similarité cosinus avec un nom cible, qui est le mot fratricide. D'accord, donc il y a 20 000 noms. [00:23:13] Le fratricide vaut 20 000 points. Et les autres mots ont d'autres valeurs. Et voici une personne seule, une personne par elle-même qui devine. Son premier essai est bit. Et on lui dit à quel point le mot bit est similaire au fratricide. Puis son prochain essai est birth. Et elle obtient une grande augmentation de similarité cosinus, car on peut imaginer que le mot naissance est plus proche du mot fratricide que le mot bit. D'accord ? Puis elle devine. Elle essaie de deviner argent ensuite. C'est pire. Ensuite, elle essaie singe. C'est encore pire. Elle vérifie. Elle fait un contrôle de santé mentale. Elle essaie naissance. Ça grimpe à nouveau. Puis elle essaie bébé. Ce n'est pas un mauvais essai. Naissance à bébé. Mais bébé les éloigne de fratricide. Et ensuite dame, et ainsi de suite. Et ils naviguent. Et ils devinent. Et ils devinent. Et ils devinent. Et ils n'arrivent nulle part près de fratricide à la fin. Maintenant, dans cette autre situation, nous avons un groupe de personnes, mais pas de bots. Et maintenant, les gens peuvent, en plus de faire leurs propres devinettes, voir les devinettes des personnes autour d'eux. Et construire sur les idées des autres. D'accord ? Créé. Comme à fabriquer la canne à pêche ensemble. [00:24:13] Donc, cette personne, son premier essai est chien. Mais son prochain essai est bouclier. On peut voir que bouclier est plus proche de fratricide que chien. Et cette personne devine et devine et obtient des idées de ses voisins. Et à la fin, il se rapproche de plus en plus. Il finit avec le mot ennemi. D'accord ? En fait, soldat était sa meilleure tentative. Il avait la valeur de points la plus élevée pendant sa trajectoire.
Alors, comment l'ajout des bots a-t-il compté ? Cela montre encore une fois le résumé des résultats. Sur l'axe des x, il y a le tour. Sur l'axe des y, il y a la similarité cosinus moyenne dans cet espace vectoriel hyper-dimensionnel, qui est une mesure de la performance du groupe. Et ici, il y a un groupe d'humains qui agissent, devinent seuls. Donc, les humains qui devinent par eux-mêmes ne réussissent pas très bien, n'est-ce pas ? C'est juste une question de chance de savoir s'ils peuvent, d'une certaine manière, ou, vous savez, d'une aptitude innée en chaque humain. Ils s'améliorent un peu avec le temps, se rapprochant. Tous les groupes surpassent le solo. Et c'est un ancien résultat connu. Un groupe de personnes est plus créatif qu'un ensemble de praticiens solitaires de taille similaire. Mais ce que nous découvrons, c'est que si nous ajoutons le bot le plus similaire, le bot qui a regardé ses voisins, [00:25:17] et a trouvé, quel est leur consensus local à ce sujet ? Mes humains semblent penser que c'est un bon mot. Et ensuite, il le transmet au bot à une partie éloignée du réseau. Ce bot a considérablement amélioré la performance de ce groupe de personnes pour faire une découverte. Vous devriez pouvoir imaginer comment cela pourrait fonctionner dans un groupe d'ingénieurs ou d'autres travailleurs du savoir. Comment, par exemple, vous pouvez distribuer les connaissances de manière efficace, en évitant la pensée de groupe et en favorisant la créativité, en concevant des bots qui aident les humains à s'aider eux-mêmes. Le bot ici n'a pas de cerveau. Ce n'est pas, il ne suggère pas d'idées par lui-même. Il aide simplement les humains à partager les idées entre eux.
Ainsi, des agents d'IA simples avec un comportement interprétable peuvent renforcer la capacité de découverte créative dans des groupes humains en partageant des idées autour desquelles il y a un consensus local dans une partie du groupe avec des personnes dans une partie éloignée du groupe. Et par conséquent, le groupe peut mieux performer.
Maintenant, nous avons également commencé à expérimenter avec des systèmes physiques. Nous avons ajouté des robots humanoïdes et non humanoïdes [00:26:19] dotés d'une IA simple pour aider les groupes de personnes à travailler ensemble en les aidant à surmonter les frictions ou une incapacité à coopérer dans leurs interactions. L'un de mes exemples préférés est une expérience que j'ai réalisée avec mon ancienne étudiante diplômée, Maggie Traeger, qui est là au fond et qui est maintenant professeur adjoint à Notre Dame. Dans cette expérience, nous avons pris trois véritables humains qui sont entrés dans le laboratoire et un robot humanoïde. Nous avons conçu un petit jeu, un petit jeu de voie de chemin de fer, qui se joue sur une tablette, et ce groupe d'humains et un robot avaient la tâche de poser des rails de chemin de fer de point A à point B, comme de petits rails de Thomas le Petit Train. Nous leur avons donné des pièces à sélectionner sur la tablette, comme des pièces droites et courbées. Mais nous avons parfois conçu, bien qu'il semblait qu'il y ait un mélange de pièces et que, en principe, ils devraient pouvoir aller de point A à point B, qu'il n'y avait pas le bon nombre de courbes pour leur permettre d'atteindre leur destination. [00:27:21] Ils ne pouvaient pas le faire. Ils ne pouvaient pas résoudre le problème à leur insu. D'accord ? Donc d'abord, chaque personne prenait un tour pour poser une pièce de rail, puis la personne suivante et ainsi de suite. Ils travaillaient ensemble pour relier le point A au point B sur leurs tablettes.
Et ce que nous avons fait dans cette expérience, c'est que nous avons manipulé, et ils ont joué 30 tours de ce jeu dans ce monde virtuel. Nous avons eu 51 groupes, nous avons modifié le style de conversation des robots, spécifiquement si le robot exprimait de la vulnérabilité en reconnaissant une erreur. Donc, le robot a dit, vous savez, j'ai fait une erreur. Ou si le robot racontait des blagues de papa. Je pars du principe que tout le monde sait ce que sont les blagues de papa. D'accord. Nous avons également eu le robot qui racontait, au fait, c'est un universel culturel, comme les anthropologues dans la jungle amazonienne ont examiné les peuples indigènes et les papas là-bas racontent aussi des blagues de papa. Et les enfants sont comme, je ne peux pas croire que les blagues stupides de papa. Mais bon, en fait, il y a une théorie sur ce que les blagues de papa sont censées endurcir les enfants d'une certaine manière. C'est une théorie. Mais bon, c'est une autre tangente. Quoi qu'il en soit, nous avons fait raconter des blagues de papa à nos robots ou exprimé de la vulnérabilité. [00:28:21] Et ce qui nous intéressait, c'était de déterminer si des changements dans le discours des robots avaient le pouvoir non seulement d'affecter la façon dont les gens interagissent avec les robots, mais aussi comment les gens interagissent entre eux. Et encore une fois, cela offre la perspective de modifier les interactions sociales par l'introduction d'agents artificiels dans des systèmes hybrides d'humains et de machines.
Voici un petit exemple de, oh, et je ne vous ai pas parlé des résultats. Voici donc ce que nous avons, ainsi que l'épaisseur de ces lignes ; nous avons installé des caméras vidéo pour surveiller qui parle à qui et combien ils parlent. L'épaisseur de ces lignes indique combien la personne deux parle à la personne un, et ainsi de suite. Donc, la personne un ne parle pas beaucoup au robot. C'est une ligne fine. Et quand vous aviez des robots neutres, vous obtenez ce modèle. Mais quand vous aviez le robot vulnérable, toutes ces lignes deviennent plus épaisses et s'équilibrent. Nous avons constaté qu'un robot vulnérable augmentait l'égalité de la parole parmi les humains, augmentait le volume de la parole parmi les humains et, en fait, dans des résultats séparés, [00:29:22] augmentait la satisfaction des humains dans ce genre d'environnement.
Et voici simplement un extrait de deux tours différents qui illustrent que le robot parle d'abord de manière neutre, à la voix passive, ce qui n'affecte pas beaucoup la communication humaine. Le robot dit, d'une manière très réganesque, une erreur a été commise.
Mais au tour suivant, le robot dit, j'ai fait une erreur. Et vous pouvez juste voir ce qui se passe ici. Voyons si nous pouvons faire fonctionner cela. (25 secondes de pause) Donc, à travers de nombreuses, nombreuses dizaines de tours, voici le genre de modèle que nous trouvons. Une simple manipulation, une simple manipulation dans le modèle de discours du robot change comment les humains interagissent entre eux. [00:30:25] Et je suppose, cela ne demande pas beaucoup d'imagination pour penser à la manière dont toute notre méthode de conception de nos chatbots et tout le reste pourrait affecter, non seulement l'exemple d'Alexa que je vous ai donné au début, mais aussi la façon dont nous nous traitons les uns les autres. Les humains semblent davantage se faire confiance et s'amuser davantage dans cette situation.
Maintenant, voici encore, et je pense que c'est la dernière expérience que je vais vous montrer et ensuite je vais conclure, dans une autre expérience, nous avons développé une nouvelle plateforme cyber-physique pour tester de tels effets sociaux et en effet éthiques de types simples d'IA. Parce qu'étant donné la nature des problèmes d'action collective, l'implication de l'IA dans des groupes humains pourrait paradoxalement et involontairement supprimer des normes sociales bénéfiques déjà existantes chez les humains, telles que celles impliquant la coopération et l'altruisme que nous avons évoluées en tant qu'espèce. Donc, nous avons des centaines de milliers d'années de sélection naturelle agissant sur nous pour nous rendre capables de résoudre des problèmes d'action collective. La question est donc, eh bien, si nous déléguons une partie de cette agence à des machines, allons-nous perdre la capacité de travailler ensemble pour résoudre ces problèmes ? [00:31:32] Allons-nous en venir à dépendre de ces machines, et donc maintenant nous dégradons notre capacité innée à coopérer et à coordonner et à créer, et ainsi de suite ? Donc, dans cette expérience, en collaborant avec Hiro Shirato au CMU, un autre ancien étudiant diplômé à moi, nous avons construit une plateforme qui impliquait deux petits véhicules mécaniques dotés de Raspberry Pi, et nous l'avons connecté à un logiciel que nous avons qui nous permet d'organiser des expériences en ligne à grande échelle. Les gens étaient chez eux, et ils se voyaient assigner l'une de ces voitures, et ils conduisaient ces voitures l'une vers l'autre.
et nous les avons fait jouer au jeu du poulet. Donc dans le poulet, vous savez, comme, celui qui atteint l'autre côté le plus vite gagne. Vous êtes donc incité à ne pas céder à l'autre. Mais si chacun d'entre vous choisit de ne pas céder, alors vous vous écrasez, et vous obtenez tous les deux le pire résultat. Donc ce que les humains feraient dans cette situation, si vous jouez à un jeu de poulet itéré, c'est que vous apprendriez rapidement à prendre des tours. Cette fois, c'est votre tour d'y aller tout droit, je vais me ranger et vous laisser passer, mais la prochaine fois, vous vous rangez et me laissez passer tout droit. [00:32:35] Si nous sommes égoïstes, nous continuons à nous écraser l'un contre l'autre, comme à nous détruire encore et encore, ou stupidement, nous nous déportons tous les deux, et aucun ne bénéficie de passer tout droit. Donc, dans cette situation ici, la voiture jaune décide de se ranger, la voiture bleue continue sans entrave jusqu'à l'autre côté.
Nous avons utilisé 300 participants et 150 dyades, et ils ont été payés en fonction de la rapidité avec laquelle ils parvenaient de l'autre côté. Ensuite, nous avons ajouté un peu d'IA. Nous avons ajouté une assistance au freinage automatique, où, lorsque vous aviez une alerte de proximité, lorsque vous vous approchiez de l'autre voiture, cela freinait et vous donnait la possibilité de décider, eh bien, je devrais me ranger sur le côté et laisser passer l'autre, ou vice versa. Ou nous avons ajouté une assistance à la direction automatique, qui est, au moment où cela se rapprochait de l'autre voiture, cela déviait simplement, d'accord ? Et nous avons ajouté une fonction de communication minimale, où les gens pouvaient dire merci, ou quelque chose du genre. Juste une communication très minimale. Et d'abord, nous avons montré que l'assistance au freinage automatique, où les voitures s'arrêtent à une distance fixe avant de percuter, augmentait l'altruisme humain. [00:33:38] C'est-à-dire, céder la priorité aux autres, comme la voiture jaune le fait ici. Ainsi, l'ajout d'un peu d'assistance au freinage automatique en IA a facilité la coopération et le travail ensemble des êtres humains dans cette situation. De plus, permettre aux humains de communiquer aide davantage à réaliser des concessions mutuelles dans la condition de freinage automatique. D'autre part, l'assistance à la direction automatique, où la voiture déviait simplement, inhibait complètement l'émergence de la réciprocité entre les gens au profit de la maximisation de l'intérêt personnel. Les gens abandonnent simplement leur autonomie morale. Ils ne se préoccupent plus. Ils laissent simplement la machine dévier continuellement, et ils abandonnent, d'accord ? Donc toutes les capacités éthiques innées que les gens avaient ont maintenant été supprimées par l'ajout de l'IA dans la condition d'assistance à la direction, mais renforcées dans la condition d'assistance au freinage. Et cela devrait aussi vous faire réfléchir. Vous devriez penser, oh mon dieu, chaque petit détail que nous faisons lorsque nous programmons ces agents IA pourrait avoir de bons ou de mauvais effets sur les tendances naturelles des gens.
La capacité des gens à coopérer, à prendre des tours et à agir de façon altruiste peut s'atrophier, entraînant de pires résultats collectifs et individuels à la fin. [00:34:46] Et en fait, en résumé, l'IA peut mener à une sorte de paresse morale. (..) Voici un dernier exemple de changement durable après une exposition à l'IA dans des systèmes hybrides. Et c'est aussi un exemple de la manière dont la présence de l'IA peut changer les interactions humaines, même après que l'IA ne fait plus partie des interactions. Ainsi, en 2016, DeepMind a développé AlphaGo, et dans la même année, cet agent IA a joué contre Lee Sedol, le remarquable champion du monde coréen.
J'ai regardé le match. Je ne peux pas jouer au Go, mais je reconnais que c'est un jeu magnifique. Mon fils joue au Go. (.) Et j'étais vraiment derrière Lee Sedol. Lee Sedol est comme un héros en Corée, un peu comme nous aurions, vous savez, de grands athlètes sur nos boîtes de Wheaties et des choses comme ça. Comme, il est sur de petits paquets de nouilles et sur des paquets de céréales. Comme, je trouve ça magnifique qu'en Corée, un nerd intelligent comme moi soit considéré comme une personne importante, d'accord ? Donc, il est très populaire en Corée. Et il arrive pour le premier match, et il est trop arrogant. [00:35:47] Je peux dire qu'il est trop arrogant. Et il perd contre la machine, puis il s'excuse auprès de ses fans. Il dit, je suis vraiment désolé. C'est cinq parties. Il faut trois victoires sur cinq. Puis il joue une deuxième partie, et il perd encore. Et maintenant, il devient sérieux. Ensuite, il joue une troisième partie, et il perd. Il a perdu la compétition.
Et vous pouviez en quelque sorte voir le public, et les commentateurs s'émerveillant de la capacité de la machine à jouer au Go, faisant ces mouvements étranges et magnifiques, dont certains ont été plus tard découverts comme ayant été joués parce que nous avons des enregistrements remontant à des milliers d'années de parties de Go jouées à la cour impériale chinoise. Et ils pouvaient trouver, oh mon Dieu, c'est un mouvement médiéval que la machine a fait. Nous ne l'avions pas vu depuis si longtemps.
Et puis Lisa Dahl revient lors du quatrième jeu, et il gagne. (..) Et j'ai pleuré. J'étais si heureux. (..) Parce qu'il avait la machine, vous savez, il était revenu pour ma espèce, et il avait battu cette maudite machine. Comme, de manière héroïque, je ne pouvais pas comprendre, comme, la puissance cérébrale qui devait être nécessaire pour que Lisa Dahl fasse ça. [00:36:49] J'étais dans l'extase à ce moment-là, et si fier de lui pour avoir continué, même après avoir perdu le match.
Maintenant, ce qui est intéressant, c'est que lorsque Lisa Dahl a été interviewée par la suite, Lisa Dahl a déclaré que son propre jeu avait changé après le match. Encore une fois, l'IA aide les humains à s'aider eux-mêmes, d'accord ? Il change sa façon de jouer en raison du contact. Et des enquêtes ultérieures réalisées par d'autres scientifiques ont examiné des joueurs de Go professionnels et analysé la qualité médiane des décisions. Il y a une norme dans le Go pour évaluer la qualité d'un coup, et la nouveauté médiane, comme à quel point un coup est inhabituel. Ils ont constaté qu' lorsque AlphaGo a battu le champion du monde humain en 2016, dans le monde entier, les joueurs de Go commencent à faire de meilleurs coups, plus innovants, d'accord ? Ainsi, tous les humains jouant au Go les uns contre les autres ont changé grâce à l'ajout d'AlphaGo. L'IA aide les humains à s'aider eux-mêmes. Nous continuons donc à développer notre travail pour concevoir et ajouter des bots simples à ces situations et à d'autres impliquant des dilemmes sociaux et des problèmes d'action collective. [00:37:55] Nous examinons comment les bots peuvent affecter la coordination, la coopération, la communication, la créativité, la confiance, la navigation, le partage et l'évacuation. Et dans notre laboratoire, nous ne nous concentrons pas sur une IA super intelligente, comme les LLM ou AlphaGo, pour remplacer la cognition humaine, mais plutôt sur une IA basique pour compléter l'interaction humaine. Nous n'essayons pas d'inventer une IA super intelligente pour remplacer la cognition humaine. Nous inventons une IA simple pour compléter l'interaction humaine. Et notre IA peut se permettre d'être basique parce que les humains sont intelligents. Notre IA est comme du platine ajouté à une réaction de chimie organique. C'est juste un catalyseur. Tout ce dont nous avons besoin, c'est du catalyseur pour aider un groupe de personnes à s'améliorer.
Et bien sûr, il est important de reconnaître que l'inverse est également possible. L'IA sociale peut être utilisée pour nuire à des groupes de personnes. Mais notre approche offre un certain nombre d'autres avantages techniques et conceptuels. Tout d'abord, ces simples bots sont intelligibles et illustrent donc clairement des pouvoirs et des opportunités plus larges. Contrairement aux LLM, qui sont une boîte noire et dont on ne sait pas ce qu'elle fait, je peux vous dire exactement ce que fait notre bot. [00:38:58] C'est bruyant. Cela fait des présentations. Cela passe des messages de cette manière très spécifique. Et deuxièmement, nos expériences de bot contrôlé peuvent également fournir des éclairages sur la façon dont le comportement humain pourrait également changer de manière bénéfique. En d'autres termes, je peux prendre cela du laboratoire et je peux enseigner à un groupe d'humains à faire ce que nos bots ont fait. D'une certaine manière, vous ne pouvez pas facilement apprendre à un groupe d'humains à faire ce que ChachiPT a fait ici. Nous ne savons pas ce que fait ChachiPT, mais vous savez ce qu'ils font dans notre situation.
Je voudrais donc conclure, ceci est ma dernière diapositive, avec une métaphore. Considérez ces deux objets. Ils sont tous deux composés de carbone. Si vous prenez les atomes de carbone et les reliez d'une manière, vous obtenez du graphite, qui est mou et sombre. Prenez les mêmes atomes de carbone et reliez-les d'une autre manière, vous obtenez un diamant, qui est dur et clair. Et il y a deux idées intellectuelles clés ici. Tout d'abord, ces propriétés de douceur et de noirceur et de dureté et de clarté ne sont pas des propriétés des atomes de carbone. Ce sont des propriétés de la collection d'atomes de carbone. Et deuxièmement, les propriétés que vous obtenez dépendent de la manière dont vous connectez les atomes de carbone entre eux. Prenez les mêmes atomes de carbone et reliez-les d'une façon, vous obtenez un ensemble de propriétés. [00:40:01] Reliez-les d'une autre manière, vous obtenez un ensemble de propriétés complètement différent. De même, la nature de nos connexions affecte les propriétés de nos groupes sociaux. Ce sont les liens entre les personnes qui peuvent rendre le tout plus grand que la somme de ses parties. De nouvelles propriétés, telles que la coopération et la violence, l'innovation et la productivité, la confiance et la méfiance, la vérité et le mensonge, la richesse et la pauvreté, la santé et le bonheur, peuvent émerger et se répandre à cause des connexions, à cause des liens entre les gens, et pas nécessairement seulement à cause des personnes elles-mêmes. En fait, notre expérience du monde dépend de la structure et de la fonction des réseaux qui nous entourent, proches ou lointains. Et notre espèce a évolué pour que cela soit le cas. Et il ne devrait pas nous surprendre que nous réagissons à l'IA qui est parmi nous. Merci beaucoup.