第三部分 系统级视角——从技术可靠性到人机可信赖性
部分目标:Harness Engineering 的系统级视角在三个相互支撑的维度上展开。
- 技术可靠性(第十二、十四章):如何知道系统是否正常工作(评估与可观测性),以及如何将设计从单 Agent 扩展到多 Agent 协调——这是生产级 Harness 的工程基础。
- 知识积累层(第十三章):Skill 是从评估数据到持续演化的转化机制,将跨任务的运行经验系统化沉淀为可复用知识,使 Harness 的改进积累为组织的结构性优势。
- 人机可信赖性(第十五章):在系统变得足够复杂和自主之后,确保人类的监督意志仍然有效落地——这是技术可靠性与知识积累工作的隐含目的。
三个维度的关系:技术可靠性是地基(让系统可被测量);知识积累层是演化引擎(让测量转化为持续改进);人机可信赖性是目的(让改进始终服务于人类意图)。没有评估,就无法判断什么值得积累;没有 Skill 积累,Harness 的演化只能凭直觉推进;但没有人类在环上的有效参与,前两者积累的成果为谁服务,是一个无法回答的问题。第十六章以综合案例收尾,将三个维度整合为完整的端到端系统设计。