AI领域的agent是什么意思？

今年四月份读了斯坦福Generative Agent的论文，觉得特别好玩，花几天时间实现了这个demo。后来拿着这个demo去参加hackathon，竟然拿了二等奖还帮我赢了1300多刀。

最近提到这个demo，同事表示很有兴趣，于是仔细整理了一下，分享给大家。

代码留在文章最后。

游戏界有一种说法：过去20年的游戏在核心玩法上的创新是缓慢的，绝大多数的创新发生在技术上。

开发者在游戏内提供更大的地图，更精致的画面，庞大的细节。其中的主要目的之一是为玩家提供「沉浸感」。当玩家在游戏世界里得到自己所期望的反馈时，会获得庞大的满足感。

然而，由于技术的限制，过去的创新并没有涉足游戏的一个核心方面：世界与NPC的运行逻辑。

当玩家与世界和NPC的互动超出了规则设定的范畴时，玩家将无法获得反馈，从而产生巨大的落差。游戏界成这种体验为Breaking Immersion。

过去的开发者使出了千方百计来避免玩家产生违和感。

以荒野大镖客2为例，由于R星将immersive作为其开发的首要原则，导致其花费了8年时间，为游戏世界添加了无数的逻辑与细节，整个开发花费近5.4亿刀，可见其难度与成本。

大模型的普及可能改变这一现状

大模型可以为游戏世界的运行与NPC的行为提供逻辑，帮助游戏理解玩家的行为，让游戏世界在可信的状态下稳定运行。由此从根本上提升玩家的沉浸感。

我们把LLM在游戏中的应用分为两部分：

具体来说：

World中包含：

Agent则包括：

为了让ChatGPT理解我们游戏的世界观，我们引入一段Prompt：

为了让NPC和玩家得以与地图上的地点/物品互动，我们需要提供所有物品与地点的描述：

上述Prompts为地图的每个块都提供了文字描述，从而得以让ChatGPT理解地图上的每个地点：

具体的实现里，我们实际上需要为所有的游戏贴图都提供一段文字描述！

首先，我们要让LLM知道他现在正在扮演一个NPC：

接下来，我们设计一系列NPC：

每个NPC的核心在于：

其独特的人格 – 我们引入了一系列属性来定制其人格：description，personal history，personal knowledge，年龄，星座等等。
一系列可以与玩家交互的属性/道具：钱，道具(items)。
记忆：我们在这就用每个NPC的对话记录作为其所有的记忆。当然还可以把NPC之前的所有action也加入记忆。