【AI 边界论】【转载】论 AI 的实际能力该如何被界定

今天逛论坛的时候无意中刷到一篇帖子,顿感惊为天人,奈何没文化,只能一句卧槽。

原帖链接: 跳槽的时候发表了如下观点,CTO大喜过望给我定薪35k - 开发调优 - LINUX DO

原文:

AI Coding 的效率不取决于模型的能力,而是取决于你所使用的架构是否支持多工作树低冲突合并;
AI 的能力边界也不取决于模型的能力,而是取决于工程过程可被 token 化的范围边界在哪里。

表示边界论

定义

人工智能系统直接处理的不是现实本身,而是现实的表示。
所谓 token,在广义上指一切可被机器编码、传输、存储和运算的符号单元。
所谓 token 化,指将现实中的对象、状态、关系和过程转化为机器可处理表示的过程。

基本命题

只有进入机器表示系统的对象,才可能被人工智能处理。因而,人工智能的认知边界首先受表示边界约束。
模型本身只能执行表示变换,而不能直接触及现实。人工智能要对现实产生作用,必须借助接口、工具、传感器与执行系统形成因果闭环。
算力决定表示处理的规模、速度、成本与可持续性。

推论

人工智能能力的扩张,不只是模型能力的扩张,更是表示边界与接口边界的扩张。
多模态、工具调用、数据库连接、传感器接入,本质上都是在扩大人工智能可处理和可作用的世界。
Agent 的价值,不在于替代模型,而在于将模型嵌入现实闭环,使其从“表示变换器”变成“可作用系统”的核心部件。

AI 解析

这段话的核心意思是:

AI 的能力不是单纯由“模型有多聪明”决定的,而是由模型能看到什么、能操作什么、操作结果能否被验证和合并决定的。

可以分两层理解。

1. AI Coding 的效率瓶颈在工程架构,不只在模型

“AI Coding 的效率不取决于模型的能力,而是取决于你所使用的架构是否支持多工作树低冲突合并。”

这句话不是说模型能力不重要,而是说:当模型能力已经足够强时,真正限制效率的往往是工程组织方式。

比如一个 AI coding 系统如果只能让一个 Agent 在一个分支里串行修改代码,那么模型再强,也容易遇到这些问题:

  • 多个任务不能并行做;
  • 多个 Agent 改同一批文件,冲突严重;
  • 改完之后难以测试、回滚、合并;
  • 人类需要花大量时间协调上下文和修冲突。

而如果架构支持:

  • 多个 worktree / 分支并行;
  • 每个 Agent 负责清晰的文件或模块边界;
  • 自动测试、自动 diff、自动 code review;
  • 低冲突合并策略;
  • 可追踪、可回滚的变更流;

那么 AI coding 的吞吐量会大幅提升。

所以这里说的“效率不取决于模型能力”,更准确地说是:

在工程实践中,AI coding 的效率上限往往由协作架构、上下文隔离、任务拆分、测试反馈和合并机制决定,而不是单个模型的智力上限决定。

2. AI 的能力边界取决于什么能被表示、被 token 化

第二句话:

“AI 的能力边界也不取决于模型的能力,而是取决于工程过程可被 token 化的范围边界在哪里。”

这里的“token 化”不是狭义的文本 token,而是广义的机器可处理表示。

也就是说,AI 能处理的东西,必须先变成某种机器能编码的形式:

  • 代码可以变成文本 token;
  • 图片可以变成视觉 embedding;
  • 语音可以变成声学特征或文字;
  • 数据库可以变成结构化记录;
  • 工程流程可以变成 issue、PR、测试结果、日志、trace;
  • 现实世界状态可以通过传感器变成数据;
  • 操作动作可以通过 API、机器人、工具调用变成可执行命令。

AI 不能直接处理“现实本身”。它处理的是现实的表示。

所以它的能力边界不是抽象地由模型“聪不聪明”决定,而是由这些问题决定:

  • 现实中哪些对象被数字化了?
  • 哪些状态能被机器观察到?
  • 哪些关系能被结构化表达?
  • 哪些过程能被记录、分解、验证?
  • AI 是否有接口去读取和操作这些对象?
  • 操作之后有没有反馈闭环?

比如在软件工程里,AI 如果只能看到一段代码,它只能做局部补全。
如果它还能看到:

  • 完整仓库;
  • issue;
  • 架构文档;
  • 测试结果;
  • CI 日志;
  • runtime trace;
  • 用户反馈;
  • 数据库 schema;
  • 部署环境;

那么它能完成的任务就从“写代码片段”扩展到“参与工程闭环”。

3. “表示边界论”的含义

这段“表示边界论”可以概括成一句话:

AI 的认知边界首先是表示边界;AI 的行动边界首先是接口边界。

它包含几个层次。

第一,AI 处理的是表示,不是现实。

模型看到的不是“真实的系统”,而是代码、日志、图片、传感器数据、API 返回值等表示。现实没有进入表示系统,就对 AI 不存在。

第二,模型本质上做的是表示变换。

比如:

  • 把需求描述变成代码;
  • 把错误日志变成 bug 判断;
  • 把图片变成文字描述;
  • 把数据库记录变成分析结论;
  • 把任务目标变成执行计划。

模型本身不直接改变现实。它要改变现实,必须通过工具。

第三,AI 要成为“可作用系统”,需要闭环。

闭环是:

现实状态 -> 机器表示 -> 模型推理 -> 工具/API/执行器 -> 改变现实 -> 新反馈

例如 AI coding 的闭环是:

代码仓库 / issue / 日志
-> 模型理解
-> 修改代码
-> 运行测试
-> 查看失败
-> 再修改
-> 提交 PR

如果没有测试、日志、运行环境、版本控制、合并机制,AI 就只能“生成代码”,而不是可靠地“完成工程任务”。

4. Agent 的价值

这段话最后说:

“Agent 的价值,不在于替代模型,而在于将模型嵌入现实闭环,使其从‘表示变换器’变成‘可作用系统’的核心部件。”

意思是:Agent 不是比模型更神秘的东西。Agent 的关键作用是把模型接入:

  • 文件系统;
  • shell;
  • 浏览器;
  • 数据库;
  • API;
  • 测试框架;
  • CI/CD;
  • 任务队列;
  • 传感器;
  • 执行器。

模型单独存在时,只是在输入和输出之间变换表示。
Agent 把它放进一个有观察、有行动、有反馈、有记忆、有工具的系统里,于是它才具备持续完成任务的能力。

5. 一句话总结

这段话其实是在反对“只看模型智商”的观点。

它强调:

AI 的实际能力 = 模型能力 × 表示范围 × 工具接口 × 反馈闭环 × 工程组织方式。

对于 AI Coding 来说,就是:

不是一个更强模型自动带来 10 倍工程效率,而是当代码、任务、测试、日志、分支、合并、部署这些工程过程都被良好 token 化并接入闭环后,AI 才能真正扩大产能。