到底什么才是Agent?我认为,成为Agent只需符合一个条件:如果把大模型能力去掉,这个应用就不成立了,那它就是一种Agent。因此,Agent的本质是一种AI应用开发的模式。
Chatbot是最基本的通用Agent,如果把自然语言看做是人类大脑的汇编语言,Chatbot是使用人脑汇编语言操纵大模型的最底层。与CPU汇编语言最大的不同在于,任何人类(不识字亦可通过语音)都可以直接介入大模型操作,无需任何抽象中间层。
但是,自然语言的表达能力有限,无法精确描述和执行任务,自然语言的上下文依赖性,导致无法在多轮对话中保持一致性,自然语言的模糊性,导致任务天然不精准。为了改善这些问题,我们需要引入计算机语言这种形式化语言来做增强。
做这种增强过程中需要遵循的一些原则,我们称之为Agentic设计模式。通过大模型处理自然语言与通过CPU处理混合语言,综合运用这两种语言完成确定性的任务,我们可以称之为Agentic应用。自然语言能力提升了应用的能力上限,计算机语言保证了应用的能力下限。
同时,这个原则也适用于超越自然语言的多模态语义型大模型。人类个体通过交互设备,参与到智能模型、计算机系统,以及其他人类个体,组合而成的完成特定任务的自适应智能体之中。而自然语言交互可能会作为主要交互接口之一暴露给人类个体。