现在很多公司一开会，就会有人说：我们是不是也该做个 Agent？听起来很先进

22:45 · May 12, 2026 · Tue

现在很多公司一开会，就会有人说：我们是不是也该做个 Agent？

听起来很先进。但问题是，很多所谓的 Agent 项目，从一开始就不该启动。

最近也有些同学跑过来问我，上来就拿着一个场景问要怎么设计对应的 Agent。

我觉得大家首先得想清楚，你的需求场景到底适不适合做 Agent，再考虑怎么做的问题。

Anthropic 的工程师最近给了一个判断框架，我觉得非常中肯，分享给大家。

在考虑要不要做个 Agent 时，就看下面四个问题：

一、任务够不够模糊？

如果一件事能写成明确的步骤，并且能产出确定性的结果，那用脚本或工作流就行了，不需要 Agent。

Agent 解决的是 "你只能给目标，没法写死路径" 的问题。

比如分析代码性能下降的原因，比如把一个模糊需求拆成技术方案 —

中间要判断、搜索、比较、调整，没有固定路线。

流程非常清楚的事，别上 Agent。

路径不确定的事，才轮得到它。

二、值不值得做？

Agent 不免费。

模型成本、工程投入、权限管理、异常处理、人工审核 — 全是钱。

如果一个人每天花两分钟点几下按钮，你搞一个 Agent 来省这两分钟，投入产出比大概率是负的。

值得做的场景长这样：重复发生、吃高价值人力、决策复杂、结果对业务有明显影响、做好后能规模化复用。

Agent 不该解决 "有点烦" 的问题，该解决 "很贵" 的问题。

三、瓶颈到底在哪？

很多人看到任务没做好，第一反应就是"做个 Agent"。

但得先分清：问题是流程需要编排，还是模型本身不行？

比如全自动 Coding Agent，听着很美。

但如果模型连基础代码修改都经常写错，那你做出来的不是自动开发，是自动制造 bug。

虽说 Harness 做好后可以提升上限，但前提也得是模型的能力本身能过关。

底层不稳，上层编排再漂亮也白搭。

模型能力没验证清楚之前，别急着做 Agent。

四、搞砸了代价多大？

整理文档、生成草稿，错了可以改。

但删数据库、发合同、改线上配置、封账号 — 这些事错一次可能就是事故。

高风险场景不是不能用 Agent，但不能让它完全自主。

哪些动作自动执行，哪些必须人确认，出错能不能回滚 — 这些边界必须提前画好。

当老板说 "做个 Agent 吧" 的时候，先拿这四个问题过一遍：

模糊度够高吗？ - 价值够大吗？ - 瓶颈是 Agent 能解决的吗？ - 出错代价可控吗？

答得清楚再动手。