AI 工程手册

作者:Florence J.Rachel L.

有一种变化,正在悄悄发生。 过去的软件,是确定的。 输入是什么,输出就是什么。 程序是一条被严格控制的路径:逻辑、分支、状态机、接口协议。 工程师的工作,是把世界压缩成可以被代码精确描述的形式。 但现在,这种方式开始失效了。

越来越多的系统,不再直接计算答案,而是生成答案。 它们不再严格执行规则,而是在不确定性中做出“看起来合理”的决策。

于是,软件的本质发生了改变。

一种新的范式

今天的系统,往往长这样:

  • 一个模型负责生成与理解
  • 一个检索系统提供外部记忆
  • 一组工具连接真实世界
  • 一个评估系统判断结果是否可接受

代码不再直接解决问题。代码开始组织一个“会思考的系统”。 这听起来很抽象,但工程师很快就会意识到一件事:

你写的已经不再是程序,而是一个系统的“行为条件”。

这个系统可能会犯错,会犹豫,会偏离目标。 你无法完全控制它,但你可以约束它、引导它、修正它。 这是一种新的工程范式。

我们把它称为:AI 工程系统。

为什么要读这本书

关于 AI 的资料已经非常多了,论文、博客、开源项目、教程——几乎什么都有。但它们大多解决的是局部问题:

  • Transformer 是如何工作的
  • RLHF 是怎么训练的
  • RAG 怎么搭
  • 推理怎么加速

这些都很重要,但有一个问题很少被系统性地回答:

这些东西是如何组合成一个完整系统的?

在真实世界里,一个 AI 系统从来不是单一技术。它同时包含:

  • 训练(预训练、中训练、对齐)
  • 模型(架构选择、能力分布)
  • 推理(延迟、KV cache、系统优化)
  • 应用(RAG、工具、智能体)
  • 以及评估与反馈回路

更重要的是:这些部分是强耦合的

  • 训练方式会改变推理行为
  • 模型结构会影响系统延迟
  • 检索设计会改变输出质量
  • 工具接口会决定系统是否可靠

如果你只理解其中一部分,你很难真正理解系统。

我们在试图回答什么

这本书只围绕一个问题展开:

现代 AI 系统是如何被构建的?

为了回答这个问题,我们把系统拆成五层: 基础 → 训练 → 模型 → 推理 → 应用 这不是一种分类方式,而是一种观察角度。你可以从 Transformer 开始,一路走到智能体系统;也可以从一个应用问题出发,反推它背后的训练与模型结构。当这些层之间的联系变得清晰时,AI 工程才会变成一个可以被理解的系统,而不是一堆技术名词。

两条写作原则

这本书遵循两条简单的原则。

1. 问题重于答案

当模型可以轻易生成答案时,真正稀缺的,是问题。 一个好的问题,通常比一个复杂答案更有价值。 我们更关心:

  • 为什么 KV cache 能降低复杂度?
  • 为什么 LoRA 有效?
  • 为什么 RAG 有时会让系统变差?
  • 为什么一个 agent 会“越用越笨”?

这些问题,才是理解系统的入口。

2. 图表重于文字

当文字可以无限生成,文字本身不再是证据。 结构才是。 一个好的图,往往比一页文字更接近真实。 因为它暴露了系统的约束、路径和权衡,而不是表面的描述。 所以你会在本书中看到大量结构图:它们不是装饰,而是推理的一部分。

为什么有面试题

有一个很常见的错觉:

“我已经理解了。”

但只要有人问一句:

“那你解释一下为什么?”

理解就会崩塌。 因此,本书收录了大量来自真实 AI 工程面试的问题。 不是为了考试。 而是为了让你检验一件事:

你是真的理解,还是只是见过这些词。

当你能清晰回答这些问题时,你才真正理解了这个系统。

如何阅读这本书

这本书不是一本“从头到尾顺序读完”的书。

你可以:

  • 从基础开始,建立完整心智模型
  • 从应用开始,反推系统结构
  • 或者直接跳到你正在构建的那一层

如果你在构建一个智能体系统,第 7 章会比第 1 章更有用。但当系统出问题时,你最终还是会回到前面。 这本书的目的,不是给你答案。而是让你在面对复杂系统时,知道该问什么问题

目录

第一部分 大语言模型系统基础

第二部分 大语言模型训练

第三部分 模型架构

第四部分 推理系统

第五部分 AI 应用

附录

结语

感谢阅读。

读懂 AI,不是为了跟上时代。 是为了在时代改变我们之前,先站进浪里。

希望下一次浪来的时候,你已经不在门外。 你已躬身入局,做点真东西。