尼古拉斯·克里斯塔基斯 – 以社会为中心的AI会议

尼古拉斯·克里斯塔基斯:[00:00:05] 没错,人类嵌入在社会网络中,这些网络遵循非常特定的数学、生物和社会原则。而且,我们越来越多地在我们的生活中添加人工智能形式的在线代理和实体机器人,它们与我们互动,仿佛它们是社会实体。这些我们将添加到系统中的代理从道路上的无人驾驶汽车,到商店中的自助结账机,再到家庭、工厂或战场上的类人机器人,甚至消防场景中的机器人,還有无身体的自主代理,比如在线机器人和我们手机、眼镜或工作场所中的数字AI助手。这些技术以平等的方式与我们互动,仿佛它们是人类。它们将产生人类与机器的混合系统。这些系统为一种新的社会人工智能提供了机遇。

现在,让我给你一个简单的例子。当你得到一个数字助理,比如 Alexa,这个设备的制造商非常关心人机交互。这种人机交互是经过优化的。例如,如果每次你需要某样东西时都要说,抱歉,Alexa,我很抱歉打扰你。如果你不介意,能告诉我明天的天气吗?[00:01:35] 这将被视为一种荒谬的礼貌水平。你希望能够说,Alexa,天气,然后机器顺从地回应。这没问题,直到你把那个机器带到你家里,孩子们和那个机器对话,学会了无礼。然后他们去游乐场,对其他孩子无礼。因此,那个被引入我们生活中的机器,不仅仅是人机交互的问题,还涉及在机器面前的人际互动。因此,我感兴趣的不是,而是机器面前的人际互动。我们可以利用对社交网络结构和功能的理解,来评估社交人工智能在和对人类群体的使用和影响,涉及信任和合作等因素,这对于人们团结合作是必要的,并影响这些集体的行为。

让我强调一下我们正在做的一些工作,使用几种方法进行网络实验,涉及人工智能。这些实验评估人工智能如何影响人类社会互动的结构和功能。[00:02:45] 现在有一类社会互动的集体行动问题被称为协调问题。这些问题需要我们共同合作才能创造出有用的东西。有时我们通过建立中央机构来解决这些问题,例如警察、法院或政府。但通常,我们能够以去中心化的方式协调或合作解决需要我们与大量人合作的集体行动问题。我们实际上进化出了这种能力。我今天想首先讨论的一个具体的集体行动问题实际上是协调。

例如,为了避免交通堵塞,人们必须协调以做出不同于邻居的行为。因此,如果每个人同时离开他们的家,所有人都会陷入交通堵塞。但是,如果他们调整出发时间并在不同的时间段离开,那么就没有人会陷入交通堵塞。当然,你可以有某种中央权威来协调这一点。你们先离开,然后是你,接着是你。[00:03:45] 但理想情况下,你会希望人类以某种去中心化、非自上而下的方式来协调解决这个问题。

所以这是我们在2017年发表的第一个实验,探讨了这样的混合系统如何利用人工智能帮助应对这样的挑战。我们研究了参与协调任务的人类小组的表现。我们的范式借鉴了计算机科学中的一个问题,称为图着色问题。这是计算机科学中的经典问题。但我们所做的是将其应用于人类。因此,我们招募了4000人,并将他们分配到230个在线小组中。这些人被放置在这些小组中,他们被随机分配到我们创建的一个人工网络的某个位置,该结构大致上类似于真实的人类网络。他们被放置在这些位置,并被告知他们被分配到了三种颜色中的一种,[00:04:46] 一种紫色、橙色、紫色、橙色和粉色。他们被告知必须选择一种与邻居不同的颜色。

他们被给了五分钟的时间来完成这个任务。所以这些人会看看他们的邻居。每个人环顾四周,他们会说,例如,这个家伙是粉红色的。他看到自己有一个粉红色的邻居和一个橙色的邻居。他应该做的是切换为紫色。而这里的红线表示颜色冲突。换句话说,如果相邻节点的两个颜色相同,它们就会得到一条红线。而背景中的紫线表示社会互动的结构。因此你把人们放在这里。他们每一秒或一秒半就看看他们的邻居。他们做出的切换要符合一个目标,那就是在接下来的五分钟内,他们都必须选择和邻居不同的颜色。如果他们做到这一点,那么只有这样他们才能获得报酬。我会支付你们一起工作。如果你们都以去中心化的方式合作解决这个问题,你们都会得到报酬。否则,你们将一无所获,好吗?那么在这个实验中发生了什么。在 x 轴上是以秒为单位的时间,一直到五分钟的标记。[00:05:47] 游戏持续五分钟,在这里某处。y 轴上是目标函数或颜色冲突的数量。因此在一开始,这里有 12 个颜色冲突。他们的初始颜色是随机分配的。这在这个小直方图上显示出来。所以人们开始环顾四周并切换他们的颜色。你知道,他们在切换,他们在切换。他们到达这一点,现在出现了两个之间的颜色冲突。然而,这种冲突我们称之为不可解决的冲突。因此,浅橙色的线是可解决的冲突。这位先生可以移动到紫色,解决冲突。但这些橙色的人,没有任何行动能够减少他们邻居的颜色冲突,对吧?这个家伙不能切换为紫色,因为如果他切换为紫色,他的冲突会更多。他有大约四个紫色邻居。而他不能切换为粉红色,因为他有两个粉红色邻居。所以他看看自己说,好的,最少的冲突就是保持橙色。所以现在这一组陷入了困境,对吧?[00:06:49] 他们有一个不可解决的冲突,什么也发生不了。在解决集体行动问题之前,必须等到这两个人中的一个做出反直觉的举动,切换颜色为紫色或粉红色,并暂时增加冲突。事实上,这正是发生了的。然后时间过去,人类在 245 秒时解决了问题。机器检测到解决方案,停止游戏并支付他们,好吗?

现在,因为我们有点狡猾,我们做了一些实验,偷偷地将一些人类替换为机器人。我们评估了加入赋有人工智能的机器人成为混合系统后,对小组表现的影响。当面对这种挑战时,能否向人类组添加一些机器人以提高他们的协调能力?我们添加了三个机器人,并在实验中改变了两个变量。机器人的位置,他们随机进入网络的位置,他们被放置在网络的中心,还是被放置在网络的边缘。我们还随机操控了他们的人工智能能力,以一种非常简单的方式进行操作。也就是说,我们操控了机器人是完美行动还是有一些噪音。

在完美的情况下,每隔一秒半,机器人就会观察周围的邻居,然后选择与邻居冲突最少的颜色。这可能被认为是非理性的行为。在10%的噪音情况下,他们是这么做的,但10%的时间他们选择了随机颜色。在30%的噪音情况下,他们也是这么做的,但30%的时间选择随机颜色。所以我们让机器人的错误率越来越高,噪音越来越多。

然后我们来看一下,我想我们有一些,比如说,从一个对照组开始。我们在x轴上绘制的是时间,这些是生存曲线。在y轴上是整个小组尚未解决协调游戏的概率。所以在这里,如果你看看这里,例如,在时间零的时候,[00:08:51] 只有人类组的100%,只有人类的会议是橙色的。开始时,100%的人类组尚未解决游戏。随着时间的推移,越来越多的人类组解决了游戏,所以在五分钟结束时,可能有60%的人类组解决了游戏。

那么,发生的事情是,如果在网络的中央位置放入10%的嘈杂机器人,你会发现性能明显改善。在这里,当这些添加了少量噪声的机器人位于中央时,更多的人群能够解决问题。事实上,他们将解决问题的中位时间从232秒减少到103秒。这些数据中还有其他发现。完美的机器人和过于嘈杂的机器人都是无效的。我们需要一些校准。最有帮助的是这10%的嘈杂机器人,机器人的位置也有一定的影响。但在这些实验中,我们还发现那些没有连接到机器人的人,[00:09:52] 在网络中更远离的位置。图表中,有些人是连接到机器人的,而有些人则没有。我们发现即使是这些人也开始改变他们的游戏方式。因此出现了涟漪效应和级联效应。机器人与人类互动的好处在网络中传播,并开始影响更远处的人际互动。换句话说,机器人帮助人类帮助自己,这种噪声的好处在这个社会系统中扩散。

现在让我进一步修正关于这个集体挑战的想法,以及这些简单的人工智能代理如何通过另一个类比来帮助。想象一下你有一个平面。这就像机器学习中的梯度下降。例如,你有一个平面,还有丘陵和一座山。你有不同高度的丘陵,好吗,还有一座高高在上的山,是最高的那座山。所以你被放落,我将带你们四个人,在这里某个地方放下你们,并把你们手铐在一起,每个人面朝不同的方位,[00:10:54] 然后我会让你们蒙住双眼。我会告诉你们,找到最高的山。所以你们讨论一下,你们说,为什么我们不各自朝自己的方向走一步,然后报告给团队呢?于是你向北走一步,你说,从这里往上爬。而南方说,从这里往下走。东方和西方说,从这里是水平的。所以你们都同意,往北走一步。你们不断这样迭代,直到有一天你们都说,从这里往下走。

你找到最高的山了吗?没有。(...) 你做了什么?你找到了最近的丘陵。

现在你会发现最高的山峰吗?不,你永远找不到最高的山峰。你被困住了。你在局部最优中,但在全局上却是次优。为了实现全局最优,你需要一点噪音。你偶尔需要让这群人朝反直觉的方向向山下走,或者向山坡下走。因此,他们有时会偶然性地采取一系列步骤,直到他们又回到平面上。然后,他们在这个适应性景观中四处导航,探索所有这些峰值,直到最终来到这个峰顶。[00:11:56] 而这个高峰往往是全局最优的,因为需要更大的噪音才能离开这个峰,而不是其他峰。所以现在你围绕着全局最优上下波动。在我们的工作中,我们一直在探索这种简单的编程插入到社会系统中,以看看是否可以改善人们在解决多种集体行动问题方面的表现。

现在另一个集体行动问题涉及不同的挑战,即合作,而非协调。人类常常需要合作以产生被称为公共物品的东西。灯塔就是公共物品的经典例子之一。公共物品有两个经典特征。首先,它被称为不可排他性。这意味着其他人不能被阻止使用它。如果你为自己的个人利益建造灯塔,因为你在导航海洋,不想撞上岸,这对你来说很好,但你无法阻止其他人使用它,好吗?不可排他性。[00:12:58] 其次,它是非竞争性的。这意味着一个人的消费不会减少其他人的消费。如果我使用我的灯塔的光,那么你使用的光不会减少。而这与例如一块蛋糕不同。如果我有一块蛋糕,那是我的,对吧?我可以阻止你吃它。如果我吃了它,你就没有蛋糕可吃了,好吗?所以公共物品具有这些特征,而正是这些特征使得生产公共物品非常困难。因为在建造灯塔时,诱惑往往是将你的个人利益与群体利益对立起来。如果你不为建造灯塔做出贡献,你仍然可以从中受益。因此,每个人都倾向于什么都不做,结果导致灯塔无法建成,所有人都受到损害。还值得强调的是,公共物品是有用的,因为你实际上可以借助它们生产一些东西,例如安全的海上旅行。因此,公共物品的投资不足在我们的社会中是一个严重的问题,也被称为公地的悲剧。这些公共物品,例如我们之间维持的信任规范是高效的。[00:14:01] 想想你上高中的时候。你们中的一些人上过的高中,学生之间互相信任,这意味着你可以放心把背包留在走廊里,而不必担心会有人偷它。你们中的其他人上过的高中没有相同的信任规范,因此你需要锁上背包或随时带着它。在这两种环境中,你认为哪个会让你的学习更好?对吧?是前者。因此,这个共同维护的规范是生产性的。在这种情况下,促进学习。在这里,促进安全的海上旅行等等。

在人与人之间的合作以生产公共产品的过程中,确实面临许多挑战,需要各种机制来维持这一过程。我们进行了许多实验,让人们进入网络小组,并要求他们与邻居一起进行多种类型的公共产品游戏,操控多种结构性和其他特征。因此,比如,我们几年前进行了一项实验,将人们放入这样的网络中。他们被介绍给邻居,并且玩了一个公共产品游戏,这是来自行为经济学的,例如,我可以给每个邻居一点钱。我拿一美元,分给我的邻居们。然后,科学家们将这美元翻倍。那么假设我有四个邻居。假如我有三个邻居,我给这个小组一美元。它就变成了两美元。这两美元在我们四人之间分配。因此,整个小组从两美元中获得财富,但我只拿回50美分。这两美元除以四,我只拿回50美分。所以我必须为了他人的利益做出牺牲。当然,大家会说,我不想牺牲,让其他人去给钱。我不打算给任何东西,希望其他人能贡献。但当然,如果每个人都这样做,最后又会崩溃。最佳的行为是每个人都尽可能地贡献。因此,在这种情况下,我们开始了游戏。蓝点代表的,是那些友好合作的人。他们最大限度地给予邻居,创造公共产品,比如建灯塔。而红点则是没有贡献的剥削者,也被称为背叛者。我们在这个实验中发现,我们复制了一个已知30年的结果,即合作在群体中崩溃。到了游戏的最后,多轮过后,几乎每个人都变成了背叛者,除了这些在一旁的小蓝人,他们在自己之间维持着文明。你也可以想象,比如为了大学生回忆高中时光,想起科学老师分配你们四个人做一个小组项目,而你们将获得相同的成绩。你被分配到三个懒惰的家伙身边。那么,你有两种选择。要么你做所有的工作,他们也获得A,因为你想得A。要么你说,这太荒谬了。我不想让这些懒鬼从我的辛勤工作中获益。你说,我也不打算做事,结果你们都得F,这不是一场可怕的困境吗?结果是人类最终会选择后者。他们都会选择得到F,因为他们不想当傻瓜继续贡献。因此,合作在社会系统中一般都会崩溃。但我们所做的是,再次添加了一些不同类型的机器人。我们添加了一些简单的A机器人。这些机器人就像小婚姻中介。他们在社交互动中寻求帮助,观察谁在与谁互动,并向系统中的人们提出建议。你知道吗?你应该切断与你的剥削者的联系,改为与这里的这个好人建立联系。仅依靠这种温和的重组建议,我们发现,在我们与64个小组超过1000人的实验中,这些机器人不仅能够稳定合作,而且首次显示由于添加这些类型的机器人,合作实际上可以从基线提高。随后,DeepMind重新复制了我们的结果,并在大约一年或两年后发表了一篇扩展的论文。

在另一个实验中,我们探索了机器人如何影响群体创造力。[00:18:07] 因为寻找新想法是困难的。理论和实验表明,群体可能比个人更能够识别和保留创新,通过分享他们的发现。

但群体内部的创新面临着自身的挑战,包括群体思维。对吧?如果你把一群人放在一起,他们可能会过早地集中于一个次优的想法。

或者你可能想象,一个群体会集体拥有更大的智慧,能够想出更多的想法。例如,如果你给一群人一个完善钓鱼竿的任务,你知道,第一个人可能会说,嗯,我们为什么不在一根绳子的尽头放一个钩子呢?然后这个人正在拿着带钩子的绳子。然后有人说,为什么我们不在绳子上加一根棍子呢?哦,这是个好主意。因此,他们结合他们的知识,然后这样做。然后有人说,嗯,钩子上的饵浮在水面上。我们加一个波浪,让它往下沉。好吧,现在它沉得太深了。我们加一个浮漂,这样就知道它在哪里,然后就这样。人们创新,在彼此之间分享知识,跨越时间保留知识,[00:19:08] 这样你就得到这些是多个分享想法和创造的人的复合产品的文化遗产。

因此,我们想创建一个游戏,让一群人在一个景观中寻找最佳想法。我们决定使用名词作为思想的代理。我们从经典计算机科学的词汇到向量语料库中提取了20,000个名词。所以我们提取了20,000个名词。这些名词之间的距离可以通过余弦相似度度量来定义。你可以想象一个超维度的向量空间,其中猫与狗的相似度高于与桌子的相似度。他们这样做的方式是观察猫和狗在网站上共同出现的频率。因此,他们有一个网站的宇宙和20,000个名词的宇宙。他们说这两个名词经常共同出现,而另两个名词则不常共同出现。他们创建了一个300维的向量空间。[00:20:08] 现在你可以描述任何两个名词的相似度。我们决定使用名词作为思想的代理。我们提取了这20,000个名词。然后我们选择了一组名词。想象一下,我们随机选择了一个名词,但我们选择了一组。比如,braggadocio就是一个名词。所以我们选择了braggadocio。我们说,这是我们希望这一组人找到的完美想法。然后,在这个向量空间中,所有接近braggadocio的名词都会被排除。因此,你有一个得分最高的名词,获得20,000分,而其他名词则是离得最远的名词。我们将人类放入这个系统,并告诉他们,找到这个词。我们不告诉他们这个词是什么。然后我们告诉他们这些词的分数值。因此,他们开始猜测。当他们猜测时,他们会得到反馈。他们会说,哦,这个词的分数比另一个词高。他们越来越接近,并且开始彼此分享知识。他们尝试创造性地解决问题。

所以每个名词在一个语义空间或无缝的景观中与其他名词相关联。[00:21:10] 我们有18个不同的目标名词,就像我们从这20,000个名词的景观中在18个不同的位置拔起一个峰。并且这些名词刻意选择了不寻常的,如手足相残、鞋拔、肉瘤、制图等等。然后我们进行了几种条件下的实验,包括人们独自尝试穿越景观的情况,人们组成小组共同努力穿越景观,或者人们组成小组但同时也有一些机器人在里面,试图帮助他们发挥创意。机器人之所以有效,是因为它们能通过相互交流将信息从网络的一个区域传递到另一个区域。例如,机器人二号可以将“天空”或“汽车”传递给机器人一号。以下是一个网络示例。

我们让人们参与进来。方形的点是机器人。而这个机器人有四个互动,而这个机器人有,我不知道,有六或七个互动。人类在开始时开始猜测。[00:22:12] 在游戏的第一轮中,他们根本没有任何猜测的基础。他们猜测天空、汽车、兔子、老鼠、狗、猫、书桌。如果我问你们,选一个名词来猜,你们可能会猜房子、太阳、月亮、猫或狗,或者一些小的典型名词。然后他们被告知分数,例如老鼠、狗、猫、书桌等与肉瘤的相似程度。然后他们被告知这些名词相对于目标名词肉瘤的分数。然后这些分数被宣布给他们。然后这个机器人可以查看周围人类的分数,并且可以对这个机器人传递一个随机选择或最高分数或最低分数,类似于一个从一个地区或一群试图解决问题的人传播信息到另一个地区的后门通信渠道。因此,让我们看看一些例子,以便更好地理解这个,因为这可能很难理解。人们玩了大约25轮这个游戏。这里是一个与目标名词的余弦相似度,即词汇“ fratricide”。好吧,总共有20000个名词。[00:23:13] “fratricide”的分数是20000分,而其他词有其他的分数。这里有一个独自猜测的人。于是他们的第一次猜测是“bit”。他们被告知“bit”与“fratricide”的相似程度。然后他们的下一次猜测是“birth”。并且他们的余弦相似度大幅上升,因为你可以想象,词“birth”比词“bit”更接近“fratricide”。好吧?然后他们进行下一个猜测,尝试“money”。那更糟糕。然后他们尝试“monkey”。那更糟糕。他们检查。他们进行一个合理性检查。他们尝试“birth”。结果又上升。然后他们尝试“baby”。这不是一个坏猜测。从“birth”到“baby”。但是“baby”让他们更远离“fratricide”。然后是“lady”,依此类推。他们在进行猜测。他们在进行猜测。他们在进行猜测。到最后,他们离“fratricide”仍然远远不及。现在在另一个情况下,我们有一群人,但没有机器人。现在,人们可以除了自己进行猜测外,看到周围人的猜测并建立在他人的想法上。好吧?创建了。就像一起制作钓竿一样。[00:24:13]所以这个人的第一次猜测是“dog”。但他们的下一次猜测是“shield”。你可以看到“shield”比“dog”更接近“fratricide”。而这个人正在猜测,猜测,并从他的邻居获取输入。到了最后,他越来越接近。他最终得到了“foe”这个词。好吧?实际上,“soldier”是他最好的猜测。在他的轨迹中,得分最高。

那么,添加机器人的重要性是什么呢?这再次显示了结果的摘要。x轴是轮次,y轴是在这个高维向量空间中的平均余弦相似度,这是衡量团队表现的一个指标。这是一组孤立行动、进行猜测的人类。那些独自猜测的人表现得并不好,对吧?他们,只是依靠偶然,或者说每个个体人类天生的能力。他们随着时间的推移会稍微好一点,逐渐接近。所有团队的表现都超过了孤立个体。这是一个众所周知的结果。与类似规模的单独实践者相比,一组人更具创造力。但是我们的发现是,如果我们添加最相似的机器人,这个机器人观察它的邻居,[00:25:17] 并发现他们对于这里的地方共识是什么?我的人类似乎认为这是一个好词。然后它将信息传递给网络另一端的机器人。那个机器人显著提高了这一人群的表现,促成了发现。你应该能够想象这在一组工程师或其他知识工作者中是如何运作的。你可以如何有效地分配知识,避免群体思维并促进创造力,设计出帮助人类自助的机器人。这里的机器人并没有大脑。它不是自我提出想法的,它只是帮助人类在彼此之间传播想法。

因此,具有可解释行为的简单人工智能代理可以通过在团队中将一部分的地方共识的想法与远程部分的人分享,从而增强人类团队在创造性发现方面的能力。结果,团队的表现能够提升。

现在,我们也开始尝试物理系统。我们添加了具备简单人工智能的人形和非人形机器人 [00:26:19],与人类的面对面小组互动,并展示了它们如何能够帮助人类小组更好地合作,克服摩擦或合作困难。我最喜欢的例子之一是我与我的前研究生Maggie Traeger进行的一个实验,她在后面,现在是诺特丹大学的助理教授。这个实验中,我们邀请了三名真实的人类进入实验室和一个人形机器人。我们设计了一个小游戏,一个在平板电脑上玩的铁路轨道游戏,这组人类和机器人需要完成从A点到B点的铺轨任务,就像小火车头的铁路轨道一样。然后我们给了他们一些可以在平板上选择的轨道片,比如直轨和弯轨。但我们精心设计了一个问题,尽管看似有很多轨道片,并且原则上他们应该可以从A点到B点,但实际上我们设计的弯轨数量不够,使他们无法从A点到B点。[00:27:21] 所以他们无法解决这个问题,却浑然不觉。好吧?首先每个人轮流铺设一段轨道,然后下一个人再铺。大家一起努力在他们的平板上连接A点和B点。

在这个实验中,我们操控了机器人的对话风格,并且他们在这个虚拟世界中进行了30轮游戏。我们有51组参与者,操控了机器人的对话风格,特别是机器人是否通过承认错误来表现脆弱性。因此,机器人会说,我犯了一个错误。或者机器人讲冷笑话。我假设每个人都知道冷笑话是什么。好的。所以我们还让机器人讲,顺便说一句,这是一种文化普遍现象,像亚马逊丛林中的人类学家研究的土著人民,那里的父亲也讲冷笑话。孩子们会说,我真不敢相信爸爸的愚蠢笑话。但无论如何,实际上有一种理论认为,讲冷笑话是为了使孩子们在某种程度上变得坚强,这是一个理论。不管怎样,那是另一个话题。总之,我们让机器人讲冷笑话或表现脆弱性。[00:28:21] 我们感兴趣的是,机器人的言语变化是否能影响人们与机器人的互动方式,甚至影响人们彼此之间的互动方式。再一次,这为通过引入人工智能代理到人类与机器的混合系统中,修改社会互动提供了可能性。

所以这就是一个小例子,哦,我还没告诉你结果。那么这是,当我们有,嗯,这些线的厚度,我们设置了摄像头来监控谁在和谁说话,以及他们说话的多少。这些线的厚度表示第二个人与第一个人说话的频率等等。因此,第一个人对机器人说话的频率很低。这是一条细线。当你有中立机器人时,你会得到这种模式。但当你有脆弱机器人时,这些线都变厚了并且趋于一致。因此,我们发现脆弱机器人增加了人类之间的语言平等性,增加了人类之间的言语音量,并且在后来的结果中,[00:29:22] 实际上,增加了人类在这种环境中的满意度。

这里有一段关于两个不同回合的视频片段,展示了机器人首先以中立的方式讲话,以被动语态,这对人类交流没有太大影响。机器人说,像里根那样,发生了一些错误。

但在下一个回合,机器人说,我犯了一个错误。你可以就看看这里发生了什么。我们来看看能不能让这个工作。 (25秒停顿)因此,在许多次运行中,这是我们发现的模式。因此,简单的操控,简单的操控在机器人的讲话模式上改变了人类彼此之间的互动。[00:30:25] 我假设,这并不难想象我们设计聊天机器人的整体方式可能会影响我们彼此的对待。人们似乎在这种情况下更信任彼此并且更快乐。

现在这里仍然,我认为这是我将要向您展示的最后一个实验,然后我将结束。在另一个实验中,我们开发了一个新型的网络物理平台,以测试简单类型的人工智能的社会和伦理影响。因为考虑到集体行动问题的性质,人工智能在群体中的参与可能会悖论地及无意中抑制人类现有的有益社会规范,例如那些涉及合作和利他主义的规范,而这正是我们作为一个物种进化所具备的。因此,我们有数十万年的自然选择在我们身上发挥作用,使我们能够解决集体行动问题。那么问题是,如果我们将一些能力委托给机器,我们是否会失去共同合作解决这些问题的能力?[00:31:32] 我们是否会依赖这些机器,从而降低我们天生合作、协调和创造的能力?所以在这个实验中,我与CMU的Hiro Shirato合作,他是我的另一位前研究生,我们建立了一个平台,涉及两个配备小型树莓派的小机械车辆,并将其连接到我们有的软件上,该软件允许我们在大规模上组织在线实验。因此,人们在自己家中,被分配到其中一辆车,他们正在将这些车朝相互方向驾驶。

我们让他们玩了一个冒险游戏。在这个游戏中,像是,谁能最先到达另一边谁就赢。所以你会被激励去不让步给对方。但如果你们都选择不让步,那么你们就会相撞,双方都会遭受最糟糕的结果。在这种情况下,如果你在玩一个重复的冒险游戏,你很快会学会轮流。这次轮到你直行,我会靠边让你先行,但下次你靠边让我直行。[00:32:35] 如果我们自私,我们就会不断地相撞,一次又一次地相互摧毁,或者愚蠢地,我们都偏离了道路,谁也无法直行。所以在这里,黄色汽车决定靠边,而蓝色汽车则毫无障碍地驶向另一边。

我们使用了300名参与者和150对搭档,他们的报酬取决于他们到达对面的速度。然后我们增加了一些人工智能。我们增加了自动刹车辅助,当你接近另一辆车时,会发出接近警告并刹车,给你一个机会决定,是让路给这辆车,还是反过来。还增加了自动转向辅助,当接近另一辆车时,它会直接转向,明白吗?此外,我们增加了最基本的沟通功能,人们可以说谢谢,或类似的话。这是非常简单的沟通。首先,我们展示了自动刹车辅助,即汽车在碰撞前以固定距离停下,增加了人类的利他主义。[00:33:38] 也就是说,像这里的黄色汽车那样,让路给他人。因此,增加一点自动刹车辅助人工智能使得人们在这种情况下更容易共事与合作。而且,允许人们进一步沟通有助于他们在自动刹车条件下做出相互让步。另一方面,自动转向辅助,在这种情况下,汽车简单地偏转,完全抑制了人们之间互惠关系的产生,倾向于自我利益最大化。人们放弃了他们的道德选择权。他们不再努力。他们只是让机器不断偏转,最终放弃,明白吗?因此,所有人们所具备的内在伦理能力在自动转向条件的引入下被消除了,而在自动刹车条件下得到了增强。这也值得你深思。你应该想到,我的天啊,我们在编程这些人工智能代理时所做的每一个小决定,可能对人们的自然倾向产生好坏影响。

人们合作、轮流和无私行为的能力可能会退化,最终导致更糟的集体和个人结果。[00:34:46] 事实上,简单来说,人工智能可能导致某种形式的道德懒惰。(..) 这是一个在混合系统中接触人工智能后持久变化的最后一个例子。这也是一个例子,展示人工智能的存在如何改变人与人之间的互动,即使人工智能不再参与这些互动。2016年,DeepMind开发了AlphaGo,在同一年,这个人工智能代理与来自韩国的杰出世界冠军李世石对弈。

我观看了这场比赛。我不会下围棋,但我认为这是一项宏伟的游戏。我的儿子下围棋。(.) 我真的很希望李世石获胜。李世石在韩国就像一个英雄,就像我们伟大的运动员出现在我们的威特斯盒子上一样。他的形象出现在小面条包装和谷物包装上。我觉得很特别,在韩国像我这样一个聪明的书呆子被视为一个重要的人,好吗?所以他在韩国非常受欢迎。他在第一场比赛中出场,心态太自信。[00:35:47] 我可以看出他太自信了。他输给了机器,然后向他的粉丝道歉。他说,我很抱歉。这是五局三胜制。他接着进行了第二局,又输了。这时他开始变得认真。然后他进行了第三局,结果再次失利。他已经输掉了比赛。

你可以看到观众和评论员对机器下围棋的能力感到惊叹,机器做出了一些奇怪而美妙的棋步,其中一些后来被发现是因为我们有记录可以追溯到数千年前的围棋比赛,发生在中国的皇家宫廷。他们可以发现,天呐,这是机器下的一个中世纪棋步。我们很久没有见过它。

然后丽莎·达赫在第四场比赛中回来了,他赢了。(..) 我哭了。我太高兴了。(..) 因为他有这台机器,你知道,他为了我的物种回来过,并且战胜了那该死的机器。就像一种英雄主义,我无法理解丽莎·达赫做到这一点所需要的智力。[00:36:49] 那一刻我感到无比兴奋,并为他在输掉比赛后仍然继续努力感到骄傲。

现在,令人感兴趣的是,当莉莎·达尔在赛后接受采访时,她表示他的游戏方式在比赛后发生了改变。因此,再次说明,人工智能正在帮助人类自助,好吗?他因为接触而改变了游戏方式。而其他科学家的后续研究则调查了专业围棋选手,观察了中位决策质量。围棋中有某种标准来判断一个棋步的好坏和中位新颖度,即棋步有多不寻常。他们发现,当AlphaGo在2016年击败人类世界冠军时,全球的围棋选手开始下出更好的、更具创新性的棋步,好吗?因此,所有人类围棋玩家之间的对弈因AlphaGo的加入而发生了变化。人工智能帮助人类自助。因此,我们正在继续构建我们的工作,设计并添加简单的机器人到这些以及其他涉及社会困境和集体行动问题的情况中。[00:37:55] 我们在考虑机器人如何影响协调、合作、沟通、创造力、信任、导航、分享和疏散。在我们的实验室中,我们并不是专注于超智能的人工智能,比如大型语言模型或AlphaGo,以取代人类认知,而是专注于简单的人工智能以补充人类互动。我们并不是在试图发明超智能的人工智能来取代人类认知。我们正在发明简单的人工智能来补充人类互动。我们的人工智能可以容忍简单,因为人类是聪明的。我们的人工智能就像在有机化学反应中加入的铂,它只是一个催化剂。我们所需要的仅仅是催化剂来帮助一群人变得更好。

当然,重要的是要承认,反向的情况也是可能的。社交人工智能可以被用来伤害一群人。但我们的方法提供了一些其他技术和概念上的优势。首先,这些简单的机器人是可理解的,因此清楚地展示了更广泛的能力和机会。与黑箱的LLMs不同,你不知道它在做什么,我可以准确告诉你我们的机器人在做什么。 [00:38:58] 它很嘈杂。它在做介绍。它以这种非常特定的方式传递信息。其次,我们的控制机器人实验也可以提供关于人类行为如何有益地改变的见解。换句话说,我可以将这些从实验室带出来,并教一群人去做我们的机器人所做的事情。某种程度上,你不能轻易教一群人去做ChachiPT在这里所做的事情。我们不知道ChachiPT在做什么,但你知道他们在我们的情况下在做什么。

我想以一个隐喻来结束,这是我的最后一页。考虑这两个物体。它们都是由碳构成的。如果你以一种方式连接碳原子,你会得到石墨,它是柔软而黑暗的。如果你以另一种方式连接同样的碳原子,你会得到钻石,它是坚硬而清澈的。这里有两个关键的知识点。首先,这些柔软与黑暗、坚硬与清澈的特性并不是碳原子的属性。它们是碳原子集合的属性。其次,得到哪些属性取决于你如何连接碳原子。以一种方式连接同样的碳原子,你会得到一组属性。[00:40:01] 以另一种方式连接,你会得到完全不同的一组属性。同样,我们的连接特性会影响我们社交群体的属性。人们之间的联系使整体大于部分之和。新的属性,如合作与暴力、创新与生产力、信任与不信任、真相与虚假、财富与贫穷、健康与幸福,可以因为这些联系而出现和传播,而不一定仅仅是因为人们本身。事实上,我们对世界的体验取决于我们周围近和远的网络的结构和功能。我们这个物种就是为此而进化的。我们会对周围的AI做出反应,这并不应该让我们感到惊讶。非常感谢。

类似文章