admin管理员组

文章数量:1033374

是时候停止vibe,看清AI智能体的本质了!

0 前言

AI快速发展大时代,一些术语几乎每周甚至每天都会被赋予新含义,让人一时失措,忽略很多基本原则。

本文从其中一个术语开始——智能体(Agent)

1 2025:智能体之年

2025的确是“智能体之年”。近年LLM飞速发展带来文本、图像甚至视频生成的惊天之力,但如今关注点已从“生成”转向能在数字或现实世界中采取行动的系统。

人们的氛围感兴奋可以理解。AI价值会随其“可行动性”呈指数级增长。尽管已有多年的软件自动化,但大多系统仍是静态且脆弱。如能将它们与更灵活的决策能力结合,将带来巨大突破。但真正做到这点不易!

时至今日,仍有人会问:“到底智能体是个啥?”

2 智能体定义

不同机构对“智能体”的定义并不一:

  • OpenAI 的定义
  • IBM 的定义
  • Simon Willison 在 AI 工程师大会上收集的六种不同定义

都有其合理性,但也都存在局限性。智能体的定义其实早有,并且还有专门研究多智能体系统的学术领域。

3 过去的智能体定义

回顾历史,“智能体”从无固定定义。学术研究中的智能体可以是:

  • 完全具象的机器人,能探索其环境
  • 模拟市场中的独立行为者,以预测价格动态
  • 具备内部知识表示和世界模型,并用标准化智能体语言进行通信的软件系统
  • 由多个简单个体组成的群体,可以通过自组织实现复杂行为

4 现代智能体定义

由于AI井喷式发展,智能体定义越来越多。但许多定义要么过于复杂,要么忽略一些关键点。看如下常见智能体定义,并分析可能问题:

  • “智能体是一个具备行为指令、可访问扩展能力的工具,并在动态生命周期中运行的模型。”(智能体一定需要指令吗?一定是个“模型”吗?)
  • “一个能够自主学习、适应和执行分配目标的应用程序。”(智能体一定要会学习吗?目标一定要被分配吗?)
  • “能够执行长期、开放式任务的AI系统。”(任务必须长期吗?必须要完成任务吗?)
  • “智能体 = LLM + 记忆 + 规划 + 工具 + While 循环。”(一定需要记忆吗?一定需要LLM吗?或者一定要用While循环吗?)
  • “一个可以代表用户做出重要决策的系统。”(它必须代表用户吗?能否代表自己?人类是否也是智能体?)
  • “应用程序的智能体化程度越高,LLM对控制流程的决定权越大。”(智能体必须依赖LLM吗?智能体是一个渐变的概念还是一个二元状态?)
  • “一个执行复杂、多步骤操作的AI组件,这些操作以前需要人类完成。”(任务必须是复杂的吗?如果AI执行的是人类无法完成的任务呢?杀毒软件算智能体吗?)

并非杠精批评这些定义,而是强调:“智能体”这个概念本就难定义

历史上的智能体定义过于简化,因为限制于生产力发展,很难想象软件系统能拥有如今LLM所具备能力。而现代定义则存在相反问题,过于依赖LLM,认为智能体一定要具备高度复杂功能。

5 “智能体”本质含义

可基于过去的研究成果和现代技术发展,归纳较本质的定义:

智能体是一个能够自主决策并采取行动,以在其环境中实现一个或多个目标的系统。

该定义涵盖:

  • 软件智能体(Software Agent):如自动化脚本、推荐系统
  • AI智能体(AI Agent):如大模型驱动的聊天机器人、自动驾驶系统
  • 生物智能体(Biological Agent):如咬坏你家电线的老鼠

    是时候停止vibe,看清AI智能体的本质了!

    0 前言

    AI快速发展大时代,一些术语几乎每周甚至每天都会被赋予新含义,让人一时失措,忽略很多基本原则。

    本文从其中一个术语开始——智能体(Agent)

    1 2025:智能体之年

    2025的确是“智能体之年”。近年LLM飞速发展带来文本、图像甚至视频生成的惊天之力,但如今关注点已从“生成”转向能在数字或现实世界中采取行动的系统。

    人们的氛围感兴奋可以理解。AI价值会随其“可行动性”呈指数级增长。尽管已有多年的软件自动化,但大多系统仍是静态且脆弱。如能将它们与更灵活的决策能力结合,将带来巨大突破。但真正做到这点不易!

    时至今日,仍有人会问:“到底智能体是个啥?”

    2 智能体定义

    不同机构对“智能体”的定义并不一:

    • OpenAI 的定义
    • IBM 的定义
    • Simon Willison 在 AI 工程师大会上收集的六种不同定义

    都有其合理性,但也都存在局限性。智能体的定义其实早有,并且还有专门研究多智能体系统的学术领域。

    3 过去的智能体定义

    回顾历史,“智能体”从无固定定义。学术研究中的智能体可以是:

    • 完全具象的机器人,能探索其环境
    • 模拟市场中的独立行为者,以预测价格动态
    • 具备内部知识表示和世界模型,并用标准化智能体语言进行通信的软件系统
    • 由多个简单个体组成的群体,可以通过自组织实现复杂行为

    4 现代智能体定义

    由于AI井喷式发展,智能体定义越来越多。但许多定义要么过于复杂,要么忽略一些关键点。看如下常见智能体定义,并分析可能问题:

    • “智能体是一个具备行为指令、可访问扩展能力的工具,并在动态生命周期中运行的模型。”(智能体一定需要指令吗?一定是个“模型”吗?)
    • “一个能够自主学习、适应和执行分配目标的应用程序。”(智能体一定要会学习吗?目标一定要被分配吗?)
    • “能够执行长期、开放式任务的AI系统。”(任务必须长期吗?必须要完成任务吗?)
    • “智能体 = LLM + 记忆 + 规划 + 工具 + While 循环。”(一定需要记忆吗?一定需要LLM吗?或者一定要用While循环吗?)
    • “一个可以代表用户做出重要决策的系统。”(它必须代表用户吗?能否代表自己?人类是否也是智能体?)
    • “应用程序的智能体化程度越高,LLM对控制流程的决定权越大。”(智能体必须依赖LLM吗?智能体是一个渐变的概念还是一个二元状态?)
    • “一个执行复杂、多步骤操作的AI组件,这些操作以前需要人类完成。”(任务必须是复杂的吗?如果AI执行的是人类无法完成的任务呢?杀毒软件算智能体吗?)

    并非杠精批评这些定义,而是强调:“智能体”这个概念本就难定义

    历史上的智能体定义过于简化,因为限制于生产力发展,很难想象软件系统能拥有如今LLM所具备能力。而现代定义则存在相反问题,过于依赖LLM,认为智能体一定要具备高度复杂功能。

    5 “智能体”本质含义

    可基于过去的研究成果和现代技术发展,归纳较本质的定义:

    智能体是一个能够自主决策并采取行动,以在其环境中实现一个或多个目标的系统。

    该定义涵盖:

    • 软件智能体(Software Agent):如自动化脚本、推荐系统
    • AI智能体(AI Agent):如大模型驱动的聊天机器人、自动驾驶系统
    • 生物智能体(Biological Agent):如咬坏你家电线的老鼠

      本文标签: 是时候停止vibe,看清AI智能体的本质了!