今天逛论坛的时候无意中刷到一篇帖子,顿感惊为天人,奈何没文化,只能一句卧槽。
原帖链接: 跳槽的时候发表了如下观点,CTO大喜过望给我定薪35k - 开发调优 - LINUX DO
原文:
AI Coding 的效率不取决于模型的能力,而是取决于你所使用的架构是否支持多工作树低冲突合并;
AI 的能力边界也不取决于模型的能力,而是取决于工程过程可被 token 化的范围边界在哪里。
表示边界论
定义
人工智能系统直接处理的不是现实本身,而是现实的表示。
所谓 token,在广义上指一切可被机器编码、传输、存储和运算的符号单元。
所谓 token 化,指将现实中的对象、状态、关系和过程转化为机器可处理表示的过程。
基本命题
只有进入机器表示系统的对象,才可能被人工智能处理。因而,人工智能的认知边界首先受表示边界约束。
模型本身只能执行表示变换,而不能直接触及现实。人工智能要对现实产生作用,必须借助接口、工具、传感器与执行系统形成因果闭环。
算力决定表示处理的规模、速度、成本与可持续性。
推论
人工智能能力的扩张,不只是模型能力的扩张,更是表示边界与接口边界的扩张。
多模态、工具调用、数据库连接、传感器接入,本质上都是在扩大人工智能可处理和可作用的世界。
Agent 的价值,不在于替代模型,而在于将模型嵌入现实闭环,使其从“表示变换器”变成“可作用系统”的核心部件。
AI 解析
这段话的核心意思是:
AI 的能力不是单纯由“模型有多聪明”决定的,而是由模型能看到什么、能操作什么、操作结果能否被验证和合并决定的。
可以分两层理解。
1. AI Coding 的效率瓶颈在工程架构,不只在模型
“AI Coding 的效率不取决于模型的能力,而是取决于你所使用的架构是否支持多工作树低冲突合并。”
这句话不是说模型能力不重要,而是说:当模型能力已经足够强时,真正限制效率的往往是工程组织方式。
比如一个 AI coding 系统如果只能让一个 Agent 在一个分支里串行修改代码,那么模型再强,也容易遇到这些问题:
- 多个任务不能并行做;
- 多个 Agent 改同一批文件,冲突严重;
- 改完之后难以测试、回滚、合并;
- 人类需要花大量时间协调上下文和修冲突。
而如果架构支持:
- 多个 worktree / 分支并行;
- 每个 Agent 负责清晰的文件或模块边界;
- 自动测试、自动 diff、自动 code review;
- 低冲突合并策略;
- 可追踪、可回滚的变更流;
那么 AI coding 的吞吐量会大幅提升。
所以这里说的“效率不取决于模型能力”,更准确地说是:
在工程实践中,AI coding 的效率上限往往由协作架构、上下文隔离、任务拆分、测试反馈和合并机制决定,而不是单个模型的智力上限决定。
2. AI 的能力边界取决于什么能被表示、被 token 化
第二句话:
“AI 的能力边界也不取决于模型的能力,而是取决于工程过程可被 token 化的范围边界在哪里。”
这里的“token 化”不是狭义的文本 token,而是广义的机器可处理表示。
也就是说,AI 能处理的东西,必须先变成某种机器能编码的形式:
- 代码可以变成文本 token;
- 图片可以变成视觉 embedding;
- 语音可以变成声学特征或文字;
- 数据库可以变成结构化记录;
- 工程流程可以变成 issue、PR、测试结果、日志、trace;
- 现实世界状态可以通过传感器变成数据;
- 操作动作可以通过 API、机器人、工具调用变成可执行命令。
AI 不能直接处理“现实本身”。它处理的是现实的表示。
所以它的能力边界不是抽象地由模型“聪不聪明”决定,而是由这些问题决定:
- 现实中哪些对象被数字化了?
- 哪些状态能被机器观察到?
- 哪些关系能被结构化表达?
- 哪些过程能被记录、分解、验证?
- AI 是否有接口去读取和操作这些对象?
- 操作之后有没有反馈闭环?
比如在软件工程里,AI 如果只能看到一段代码,它只能做局部补全。
如果它还能看到:
- 完整仓库;
- issue;
- 架构文档;
- 测试结果;
- CI 日志;
- runtime trace;
- 用户反馈;
- 数据库 schema;
- 部署环境;
那么它能完成的任务就从“写代码片段”扩展到“参与工程闭环”。
3. “表示边界论”的含义
这段“表示边界论”可以概括成一句话:
AI 的认知边界首先是表示边界;AI 的行动边界首先是接口边界。
它包含几个层次。
第一,AI 处理的是表示,不是现实。
模型看到的不是“真实的系统”,而是代码、日志、图片、传感器数据、API 返回值等表示。现实没有进入表示系统,就对 AI 不存在。
第二,模型本质上做的是表示变换。
比如:
- 把需求描述变成代码;
- 把错误日志变成 bug 判断;
- 把图片变成文字描述;
- 把数据库记录变成分析结论;
- 把任务目标变成执行计划。
模型本身不直接改变现实。它要改变现实,必须通过工具。
第三,AI 要成为“可作用系统”,需要闭环。
闭环是:
现实状态 -> 机器表示 -> 模型推理 -> 工具/API/执行器 -> 改变现实 -> 新反馈
例如 AI coding 的闭环是:
代码仓库 / issue / 日志
-> 模型理解
-> 修改代码
-> 运行测试
-> 查看失败
-> 再修改
-> 提交 PR
如果没有测试、日志、运行环境、版本控制、合并机制,AI 就只能“生成代码”,而不是可靠地“完成工程任务”。
4. Agent 的价值
这段话最后说:
“Agent 的价值,不在于替代模型,而在于将模型嵌入现实闭环,使其从‘表示变换器’变成‘可作用系统’的核心部件。”
意思是:Agent 不是比模型更神秘的东西。Agent 的关键作用是把模型接入:
- 文件系统;
- shell;
- 浏览器;
- 数据库;
- API;
- 测试框架;
- CI/CD;
- 任务队列;
- 传感器;
- 执行器。
模型单独存在时,只是在输入和输出之间变换表示。
Agent 把它放进一个有观察、有行动、有反馈、有记忆、有工具的系统里,于是它才具备持续完成任务的能力。
5. 一句话总结
这段话其实是在反对“只看模型智商”的观点。
它强调:
AI 的实际能力 = 模型能力 × 表示范围 × 工具接口 × 反馈闭环 × 工程组织方式。
对于 AI Coding 来说,就是:
不是一个更强模型自动带来 10 倍工程效率,而是当代码、任务、测试、日志、分支、合并、部署这些工程过程都被良好 token 化并接入闭环后,AI 才能真正扩大产能。