分享
细说复旦大学,斯坦福大学智能代理AI-Agent
输入“/”快速插入内容
细说复旦大学,斯坦福大学智能代理AI-Agent
飞书用户1961
2024年7月16日修改
作者:爱吃牛油果的璐璐
原文:
https://zhuanlan.zhihu.com/p/657737603?utm_psn=1712176822735945729
Agent就是智能体的意思。
前言
最近AI圈很火的一个话题就是AI Agent了!AI创投圈也在密切关注着相关创业公司的进展。很多人说大模型都没搞明白,又来了个AI Agent…... 但是别担心Agent目前也是在起始阶段。
AI Agent能力其实是和大模型相生的,大模型的能力边界决定了AI Agent的能力边界。
最近,复旦大学,斯坦福大学都发表了对AI AGENT的看法和认识。
研究背景
早在 1950 年代,Alan Turing 就将「智能」的概念扩展到了人工实体,并提出了著名的图灵测试。这些人工智能实体通常被称为 —— 代理(Agent)。「代理」这一概念起源于哲学,描述了一种拥有欲望、信念、意图以及采取行动能力的实体。斯坦福大学的一篇名为《Generative Agents: Interactive Simulacra of Human Behavior》的论文深入研究了记忆、反应和计划的AI Agent。
什么是AI Agent
AI Agent 被认为是 OpenAI 发力的下一个方向。OpenAI 联合创始人 Andrej Karpathy 在近期的公开活动上说 “ 相比模型训练方法,OpenAI 内部目前更关注 Agent 领域的变化,每当有新的 AI Agents 论文出来的时候,内部都会很兴奋并且认真地讨论 ” 。
在人工智能领域,这一术语被赋予了一层新的含义:具有自主性、反应性、积极性和社交能力特征的智能实体。
AI Agent,它被设计为具有独立思考和行动能力的AI程序。你只需要提供一个目标,比如写一个游戏、开发一个网页,他就会根据环境的反应和独白的形式生成一个任务序列开始工作。就好像是人工智能可以自我提示反馈,不断发展和适应,以尽可能最好的方式来实现你给出的目标。
NLP 到 AGI 的发展路线
NLP 到 AGI 的发展路线分为五级:语料库、互联网、感知、具身和社会属性,那么目前的大型语言模型已经来到了第二级,具有互联网规模的文本输入和输出。在这个基础上,如果赋予 LLM-based Agents 感知空间和行动空间,它们将达到第三、第四级。进一步地,多个代理通过互动、合作解决更复杂的任务,或者反映出现实世界的社会行为,则有潜力来到第五级 —— 代理社会。
为什么需要AI Agent
为什么大语言模型(LLM)刚流行不久,就需要AI Agent呢?LLM与LangChain 等工具相结合,释放了内容生成、编码和分析方面的多种可能性,目前在ChatGPT插件中比较有代表性的插件就是code interpreter。在这方面的应用上Agent的概念应用发挥着举足轻重的作用。
关于lang chain更多介绍:
爱吃牛油果的璐璐:(万字长文)手把手教你认识学会LangChain
这里可以将Agent视为人工智能大脑,它使用LLM进行推理、计划和采取行动。
语言模型 (LLM) 仅限于它们所训练的知识,并且这些知识很快就会过时。(每天用最新信息重新训练这么大的模型是不可行的。)
LLM的一些缺点
1.
会产生幻觉。
2.
结果并不总是真实的。
3.
对时事的了解有限或一无所知。
4.
很难应对复杂的计算。