【AI 边界论】【转载】论 AI 的实际能力该如何被界定

luobo · 2026 年4 月 27 日 11:42

今天逛论坛的时候无意中刷到一篇帖子，顿感惊为天人，奈何没文化，只能一句卧槽。

原帖链接：跳槽的时候发表了如下观点，CTO大喜过望给我定薪35k - 开发调优 - LINUX DO

原文：

AI Coding 的效率不取决于模型的能力，而是取决于你所使用的架构是否支持多工作树低冲突合并；
AI 的能力边界也不取决于模型的能力，而是取决于工程过程可被 token 化的范围边界在哪里。

表示边界论

定义

人工智能系统直接处理的不是现实本身，而是现实的表示。
所谓 token，在广义上指一切可被机器编码、传输、存储和运算的符号单元。
所谓 token 化，指将现实中的对象、状态、关系和过程转化为机器可处理表示的过程。

基本命题

只有进入机器表示系统的对象，才可能被人工智能处理。因而，人工智能的认知边界首先受表示边界约束。
模型本身只能执行表示变换，而不能直接触及现实。人工智能要对现实产生作用，必须借助接口、工具、传感器与执行系统形成因果闭环。
算力决定表示处理的规模、速度、成本与可持续性。

推论

人工智能能力的扩张，不只是模型能力的扩张，更是表示边界与接口边界的扩张。
多模态、工具调用、数据库连接、传感器接入，本质上都是在扩大人工智能可处理和可作用的世界。
Agent 的价值，不在于替代模型，而在于将模型嵌入现实闭环，使其从“表示变换器”变成“可作用系统”的核心部件。

AI 解析

这段话的核心意思是：

AI 的能力不是单纯由“模型有多聪明”决定的，而是由模型能看到什么、能操作什么、操作结果能否被验证和合并决定的。

可以分两层理解。

1. AI Coding 的效率瓶颈在工程架构，不只在模型

“AI Coding 的效率不取决于模型的能力，而是取决于你所使用的架构是否支持多工作树低冲突合并。”

这句话不是说模型能力不重要，而是说：当模型能力已经足够强时，真正限制效率的往往是工程组织方式。

比如一个 AI coding 系统如果只能让一个 Agent 在一个分支里串行修改代码，那么模型再强，也容易遇到这些问题：

多个任务不能并行做；
多个 Agent 改同一批文件，冲突严重；
改完之后难以测试、回滚、合并；
人类需要花大量时间协调上下文和修冲突。

而如果架构支持：

多个 worktree / 分支并行；
每个 Agent 负责清晰的文件或模块边界；
自动测试、自动 diff、自动 code review；
低冲突合并策略；
可追踪、可回滚的变更流；

那么 AI coding 的吞吐量会大幅提升。

所以这里说的“效率不取决于模型能力”，更准确地说是：

在工程实践中，AI coding 的效率上限往往由协作架构、上下文隔离、任务拆分、测试反馈和合并机制决定，而不是单个模型的智力上限决定。

2. AI 的能力边界取决于什么能被表示、被 token 化

第二句话：

“AI 的能力边界也不取决于模型的能力，而是取决于工程过程可被 token 化的范围边界在哪里。”

这里的“token 化”不是狭义的文本 token，而是广义的机器可处理表示。

也就是说，AI 能处理的东西，必须先变成某种机器能编码的形式：

代码可以变成文本 token；
图片可以变成视觉 embedding；
语音可以变成声学特征或文字；
数据库可以变成结构化记录；
工程流程可以变成 issue、PR、测试结果、日志、trace；
现实世界状态可以通过传感器变成数据；
操作动作可以通过 API、机器人、工具调用变成可执行命令。

AI 不能直接处理“现实本身”。它处理的是现实的表示。

所以它的能力边界不是抽象地由模型“聪不聪明”决定，而是由这些问题决定：

现实中哪些对象被数字化了？
哪些状态能被机器观察到？
哪些关系能被结构化表达？
哪些过程能被记录、分解、验证？
AI 是否有接口去读取和操作这些对象？
操作之后有没有反馈闭环？

比如在软件工程里，AI 如果只能看到一段代码，它只能做局部补全。
如果它还能看到：

完整仓库；
issue；
架构文档；
测试结果；
CI 日志；
runtime trace；
用户反馈；
数据库 schema；
部署环境；

那么它能完成的任务就从“写代码片段”扩展到“参与工程闭环”。

3. “表示边界论”的含义

这段“表示边界论”可以概括成一句话：

AI 的认知边界首先是表示边界；AI 的行动边界首先是接口边界。

它包含几个层次。

第一，AI 处理的是表示，不是现实。

模型看到的不是“真实的系统”，而是代码、日志、图片、传感器数据、API 返回值等表示。现实没有进入表示系统，就对 AI 不存在。

第二，模型本质上做的是表示变换。

比如：

把需求描述变成代码；
把错误日志变成 bug 判断；
把图片变成文字描述；
把数据库记录变成分析结论；
把任务目标变成执行计划。

模型本身不直接改变现实。它要改变现实，必须通过工具。

第三，AI 要成为“可作用系统”，需要闭环。

闭环是：

现实状态 -> 机器表示 -> 模型推理 -> 工具/API/执行器 -> 改变现实 -> 新反馈

例如 AI coding 的闭环是：

代码仓库 / issue / 日志
-> 模型理解
-> 修改代码
-> 运行测试
-> 查看失败
-> 再修改
-> 提交 PR

如果没有测试、日志、运行环境、版本控制、合并机制，AI 就只能“生成代码”，而不是可靠地“完成工程任务”。

4. Agent 的价值

这段话最后说：

“Agent 的价值，不在于替代模型，而在于将模型嵌入现实闭环，使其从‘表示变换器’变成‘可作用系统’的核心部件。”

意思是：Agent 不是比模型更神秘的东西。Agent 的关键作用是把模型接入：

文件系统；
shell；
浏览器；
数据库；
API；
测试框架；
CI/CD；
任务队列；
传感器；
执行器。

模型单独存在时，只是在输入和输出之间变换表示。
Agent 把它放进一个有观察、有行动、有反馈、有记忆、有工具的系统里，于是它才具备持续完成任务的能力。

5. 一句话总结

这段话其实是在反对“只看模型智商”的观点。

它强调：

AI 的实际能力 = 模型能力 × 表示范围 × 工具接口 × 反馈闭环 × 工程组织方式。

对于 AI Coding 来说，就是：

不是一个更强模型自动带来 10 倍工程效率，而是当代码、任务、测试、日志、分支、合并、部署这些工程过程都被良好 token 化并接入闭环后，AI 才能真正扩大产能。