细说复旦大学，斯坦福大学智能代理AI-Agent

用户1961

2024年7月16日修改

作者：爱吃牛油果的璐璐

原文：https://zhuanlan.zhihu.com/p/657737603?utm_psn=1712176822735945729

Agent就是智能体的意思。

common.docs_name - LarkCCM_Docs_Menu_Image

前言

最近AI圈很火的一个话题就是AI Agent了！AI创投圈也在密切关注着相关创业公司的进展。很多人说大模型都没搞明白，又来了个AI Agent…... 但是别担心Agent目前也是在起始阶段。​

AI Agent能力其实是和大模型相生的，大模型的能力边界决定了AI Agent的能力边界。​

最近，复旦大学，斯坦福大学都发表了对AI AGENT的看法和认识。​

研究背景

早在 1950 年代，Alan Turing 就将「智能」的概念扩展到了人工实体，并提出了著名的图灵测试。这些人工智能实体通常被称为 —— 代理（Agent）。「代理」这一概念起源于哲学，描述了一种拥有欲望、信念、意图以及采取行动能力的实体。斯坦福大学的一篇名为《Generative Agents: Interactive Simulacra of Human Behavior》的论文深入研究了记忆、反应和计划的AI Agent。​

什么是AI Agent

AI Agent 被认为是 OpenAI 发力的下一个方向。OpenAI 联合创始人 Andrej Karpathy 在近期的公开活动上说 “ 相比模型训练方法，OpenAI 内部目前更关注 Agent 领域的变化，每当有新的 AI Agents 论文出来的时候，内部都会很兴奋并且认真地讨论 ” 。​

在人工智能领域，这一术语被赋予了一层新的含义：具有自主性、反应性、积极性和社交能力特征的智能实体。​

AI Agent，它被设计为具有独立思考和行动能力的AI程序。你只需要提供一个目标，比如写一个游戏、开发一个网页，他就会根据环境的反应和独白的形式生成一个任务序列开始工作。就好像是人工智能可以自我提示反馈，不断发展和适应，以尽可能最好的方式来实现你给出的目标。​

NLP 到 AGI 的发展路线

NLP 到 AGI 的发展路线分为五级：语料库、互联网、感知、具身和社会属性，那么目前的大型语言模型已经来到了第二级，具有互联网规模的文本输入和输出。在这个基础上，如果赋予 LLM-based Agents 感知空间和行动空间，它们将达到第三、第四级。进一步地，多个代理通过互动、合作解决更复杂的任务，或者反映出现实世界的社会行为，则有潜力来到第五级 —— 代理社会。​

为什么需要AI Agent

为什么大语言模型（LLM）刚流行不久，就需要AI Agent呢？LLM与LangChain 等工具相结合，释放了内容生成、编码和分析方面的多种可能性，目前在ChatGPT插件中比较有代表性的插件就是code interpreter。在这方面的应用上Agent的概念应用发挥着举足轻重的作用。​

这里可以将Agent视为人工智能大脑，它使用LLM进行推理、计划和采取行动。​

语言模型 (LLM) 仅限于它们所训练的知识，并且这些知识很快就会过时。（每天用最新信息重新训练这么大的模型是不可行的。）​

LLM的一些缺点

1.
会产生幻觉。​

2.
结果并不总是真实的。​

3.
对时事的了解有限或一无所知。​

4.
很难应对复杂的计算。​

细说复旦大学，斯坦福大学智能代理AI-Agent​

细说复旦大学，斯坦福大学智能代理AI-Agent