agent原理
学习agent原理
什么是agent?
三个核心条件:
- 能自主感知输入(理解代码需求、上下文、错误信息);
- 能自主决策下一步动作(不是被动执行,而是判断 “该写代码 / 查文档 / 改 Bug / 解释逻辑”);
- 能闭环循环(行动后接收反馈,迭代优化结果,直到输出可用代码)。
那目前市场上有哪些agent工具?最火的就是目前的小龙虾 openclaw
claude code codex 或者说 kimi cli 只能是代码层面的agent,不算是标砖的agent
具体区别可以看这个对比
对比项 普通大模型(ChatGPT / 豆包) Claude Code OpenClaw(小龙虾)
核心定位 文本生成、问答 代码领域 Agent 通用本地执行 Agent
感知范围 对话上下文 代码 / 报错 / 需求 全场景指令 + 系统状态
决策能力 被动生成 代码动作决策 全流程任务规划
行动能力 仅输出文本 生成 / 修复代码 操作电脑、调用系统 / API / 插件
工具调用 内置 / 有限 内置代码工具 自主调用外部工具 + 插件市场
闭环终止 返回文本 返回可用代码 完成真实任务并反馈结果
agent原理
对比上面的条件一个一个来说
- 自主感知,本质其实还是利用大模型的理解能力,对比就是原来的传统代码条件都是写死的,你必须要符合这个条件,才会执行对应的操作
- 自主决策,本质其实还是利用大模型的决策能力,对比就是原来的传统代码条件都是写死的,你必须要符合这个条件,才会执行对应的操作
- 自主闭环循环,本质其实还是利用大模型的闭环循环能力,对比就是原来的传统代码条件都是写死的,你必须要符合这个条件,才会执行对应的操作
写了之后,发现本质都是利用大模型的能力 感觉是废话文学