agent原理
学习agent原理
什么是agent?
三个核心条件:
- 能自主感知输入(理解代码需求、上下文、错误信息);
- 能自主决策下一步动作(不是被动执行,而是判断 “该写代码 / 查文档 / 改 Bug / 解释逻辑”);
- 能闭环循环(行动后接收反馈,迭代优化结果,直到输出可用代码)。
那目前市场上有哪些agent工具?最火的就是目前的小龙虾 openclaw
claude code codex 或者说 kimi cli 只能是代码层面的agent,不算是标砖的agent
具体区别可以看这个对比
| 对比项 | 普通大模型(ChatGPT / 豆包) | Claude Code | OpenClaw(小龙虾) |
|---|---|---|---|
| 核心定位 | 文本生成、问答 | 代码领域 Agent | 通用本地执行 Agent |
| 感知范围 | 对话上下文 | 代码 / 报错 / 需求 | 全场景指令 + 系统状态 |
| 决策能力 | 被动生成 | 代码动作决策 | 全流程任务规划 |
| 行动能力 | 仅输出文本 | 生成 / 修复代码 | 操作电脑、调用系统 / API / 插件 |
| 工具调用 | 内置 / 有限 | 内置代码工具 | 自主调用外部工具 + 插件市场 |
| 闭环终止 | 返回文本 | 返回可用代码 | 完成真实任务并反馈结果 |
agent原理
对比上面的条件一个一个来说
- 自主感知,本质其实还是利用大模型的理解能力,对比就是原来的传统代码条件都是写死的,你必须要符合这个条件,才会执行对应的操作
- 自主决策,本质其实还是利用大模型的决策能力,对比就是原来的传统代码条件都是写死的,你必须要符合这个条件,才会执行对应的操作
- 自主闭环循环,本质其实还是利用大模型的闭环循环能力,对比就是原来的传统代码条件都是写死的,你必须要符合这个条件,才会执行对应的操作
写了之后,发现本质都是利用大模型的能力 感觉是废话文学
参考
- agent原理