Article
法律大脑的“驾驭工程”
30 June 2026
- Home
- Insights & News
- Insights & News Details

前言
如果你的初级助理律师对你说:“我们已经讨论了够多了,确认你想要什么吧!”,你会如何反应?
这正是我的AI智能体在简短对话后对我的请求的回应:

是的,我们的确在工作流程设计上来回讨论了几次。可是,哎,它是不是对我有点不耐烦了?
即使他[i]确实表现出不耐烦,甚至有点语带冒犯,我也只能怪我自己。我确实将我的AI智能体设置成了这样一个助手:“能帮上忙但言辞直率、有自己观点,在必要时敢于提出不同意见。”活该我被酸!
Hermes Agent – 自我进化型AI智能体
在我之前的一篇文章中, 我曾分享过使用OpenClaw(俗称“养龙虾”的个人化AI智能体)[ii]的体验。上文提到的这位“急躁型”的智能体则是Hermes Agent——Nous Research公司近期推出的个人 AI 智能体系统[iii]。它的品牌口号是“与你一同成长的智能体”。基于Hermes Agent系统创建的AI 智能体拥有更优的内存/存储配置,并且能够在与用户互动的过程中吸取教训、总结经验。这些经验教训会存储在长期记忆文件中,随着时间推移,智能体能够凭借所学内容更好地为你提供协助。
根据一些科技评论[iv],这种自我进化的特性正是Hermes Agent与OpenClaw的区别所在。即使用户在运行Hermes Agent和OpenClaw时使用一样的大语言模型(LLM)(例如两者均使用GPT-5.5),用户仍然很可能会认为Hermes Agent 展现出了更强的自我迭代与进化能力。
从我作为用家对这两个系统的使用体验来看,我确实能感受到 Hermes Agent 在底层工程架构上的一些独特改进。正如其宣传口号所述,该智能体确实能更主动地保存、检索并应用内存中的记忆知识[v]。此外,Hermes Agent运行非常稳定,目前尚未遇到任何重大缺陷,比如陷入某种未知循环或消耗数十万个token[vi]。
提示词工程(Prompt Engineering)– 上下文工程( Context Engineering )– 驾驭工程(Harness Engineering)[vii]
围绕大语言模型进行设计与架构优化,使其成为可实际使用的AI 智能体的技术方法被称为驾驭工程(Harness Engineering)。我见过一个非常简洁的定义如下:
“驾驭工程”(Harness Engineering)是关于构建AI模型周围环境的学问,而不是关于构建模型本身。模型负责推理与决策;而驾驭系统则负责执行、约束和连接。一个设计良好的驾驭系统仅向模型提供其所需的精确工具,并严格限定其使用权限[viii]。
“Harness”这个词本身就形象地描述了这项工程的本质。大语言模型就像一匹强大的马,能够以最高速度奔跑数英里而不显疲惫。然而,如果没有马具(Harness),这匹马就只能是一匹野马,而无法成为赛马或战马。马具是人类用来驾驭强大力量的工具,使这种力量得以被控制,为人类所用。
大语言模型犹如一个极度聪明的大脑:当你在聊天窗口中向其提问时(在技术术语中,这被称为提示词工程,Prompt Engineering),它会给出精准且富有智慧的回答。然而,幻觉(hallucination)是大语言模型常见的问题之一——有时其输出的答案看似正确且置信度极高,但最终往往缺乏依据。
若你先向大语言模型输入若干文档,并基于这些文档进行提问,那么你便为模型提供可靠的语境(在技术术语中,这被称为上下文工程,Context Engineering)。经过对这些文档的分析处理后,模型回答问题时出现偏差的概率将显著降低——前提是您在提问时也会提示它参考相关文档。
而驾驭工程(Harness Engineering)则将这一过程提升到了全新高度。对于像 Hermes Agent 这样复杂的 AI 智能体系统,软件工程师需要为这个聪明的“大脑”构建“血肉与躯干”,从而让整个系统能够作为一个表现稳定、可预测且高度实用的助手来运转。就像一个真正的机器人一样,该智能体能够接收指令、摄取并解读数据、通过分步推理制定计划,并最终执行任务。此时,智能体的输出不再局限于文本回复,而是可以转化为各种成果文件(Artifacts),如word文档、excel表格、ppt文稿、图像或视频。
对律师进行驾驭工程
在香港,成为一名合格执业律师的必经之路,恰恰与 AI 的驾驭工程过程不谋而合。第一步是取得法学学位,这为法律思维奠定基础;随后通过法学专业证书课程(P.C.LL.)的专业培训,使法律毕业生掌握成为执业律师所需的实践技能;此后,事务律师(Solicitor)的实习期(Training Solicitor)或大律师(Barrister)的大律师实习(Pupillage),则在实操层面上提供了更深一层的锤炼。
不仅如此,驾驭工程领域的某些理念确实能揭示如何将律师打磨成一件有用的工具:
| 1. 智能体循环(又称 ReAct 循环:推理-行动-观察) | |
| 驾驭工程概念 | 法律行业比喻 |
| 智能体循环(Agentic loop)是构建 AI 智能体的底层框架:
i. 智能体对问题进行推理(Reason); ii.架构通过调用工具执行行动(Act); iii.架构观察(Observe)现实世界的反馈,并在下一次对话循环中更新智能体的状态。 |
传统律师的工作模式往往是线性的:他们接收客户指令,把自己关在办公室里,独自完成一整块庞大的法律工作,然后将最终成品交付给客户。
在瞬息万变之商业环境中,律师必须打破这种“闭门造车”的孤岛模式。通过引入实时反馈与迭代调整的持续循环机制,方能确保法律服务与客户不断变化的商业现实保持高度契合。
|
| 2. 主控智能体与子智能体架构Orchestrating Agent & Sub-Agents Architecture | |
| 驾驭工程概念 | 法律行业比喻 |
| 在复杂的AI智能体系统中,主控智能体(Orchestrator Agent)负责统揽全局,理解宏观目标、系统约束以及用户的最终意图。核心协同智能体不处理具体的脏活累活,而是衍生出多个执行子智能体(Worker Sub-Agents)去执行特定的、彼此隔离的任务(例如研究特定课题、编写特定代码)。
子智能体本身不具备全局上下文。除非主控智能体向其传递相关参数(技术术语称为:上下文注水/数据填充 Context Hydration),否则子智能体就会产生幻觉或返回无效数据。最后,当各子智能体返回相互冲突的输出时,核心协同智能体将运行合成与解决循环(Synthesis and Resolution Loop),将数据调和并统一为一份连贯的最终答复。
|
这完美镜像了律师事务所合伙人(主控智能体)与助理律师(子智能体)之间的协作动态。合伙人掌握着全局上下文——客户的商业驱动因素、法官的性情偏好以及整体的宏观策略。
由于助理律师缺乏这种鸟瞰全局的视野,团队的整体效率便完全取决于合伙人能否精准地为其“注入(hydrate)”所需的上下文背景。合伙人提供这些背景信息亦极大有助于助理律师的成长,因为“为什么做(Why)”往往决定了“怎么做(How)”以及“做什么(What)”。
正如AI的驾驭工程,合伙人或资深律师需要对助理律师的工作成果进行提炼合成,并在发现任何冲突的调查结果时予以协调解决。
|
| 3. 会话上下文隔离Session Context Isolation | |
| 驾驭工程概念 | 法律行业比喻 |
| 大语言模型具备生成和检查代码的能力。但在生成一段复杂的代码后,它会在内部形成一条固定的“推理路径”。如果让同一个大语言模型会话去寻找这段代码中的 漏洞,它几乎注定会失败。原因在于该会话已深陷于自身的上下文历史(Context History)中。它在读取自己的逻辑时,会默认初始前提完全正确,从而陷入 AI 的证实偏差(Confirmation Bias)。
为了解决这一问题,架构工程师采用了“环节上下文隔离”技术。他们将生成的代码注入到一个完全空白、独立的“复核 AI(Reviewer AI)”中。该 AI 只接触原始输出,并根据客观标准对其进行评估。由于它与生成代码的环节相互隔离,因此能够瞬间揪出逻辑漏洞。
|
律师同样极易陷入这种完全相同的心理陷阱。如果一名律师连续 12 个小时在起草一份长达 80 页的复杂商业租赁合同,他们的大脑就会对这份文件形成一种固化的思维导图。当他们开始自行校对成果时,他们看到的并不是页面上实际写了什么,而是他们认为自己写了什么。他们被困在了自己的“会话上下文”中。
因此,强制执行独立同业复核(Independent Peer-Review),对于打破起草者证实偏差实在必不可少。在法律文件起草过程中,引入“检查员/校对员”体系至关重要。 |
| 4. 模组化工具调用Modular Tool-Use | |
| 驾驭工程概念 | 法律行业比喻 |
| 工具调用(Tool-use)是赋予AI智能体强大扩展性的核心特征。工具是完全独立、模组化的代码片段,拥有严格且标准化的输入/输出接口大语言模型不需要将这些工具硬编码在自己的“大脑”中。例如,如果大语言模型经推理认为需要进行网络搜索,它只需直接调用现成的网络搜索工具即可。由于这些工具与核心解耦,开发人员可以随时升级、更换或添加新工具,而无需重写大语言模型的核心。 | 传统的法律作业往往是“单体式”的。律师或律所倾向于将每个案件视为一个完全定制、浑然一体的独立宇宙,导致同一个人不得不同时应付深度法律研究、客户关系管理、海量文件格式调整以及商业谈判。这种模式效率极低。
而模组化的法律作业则将律所集体的专业知识拆解为清晰、可复用的“工具箱”。这使得精干的核心团队能够根据不同客户的预算和需求,灵活动态地组合出量身定制的解决方案。那些将法律服务结构化为“即插即用型模组”、而非将其视为某种单一且不透明手艺的律所,将在竞争中保持敏捷与高度的规模化扩展能力。
|
| 5. 长期记忆配置 Long-Term Memory Configuration | |
| 驾驭工程概念 | 法律行业比喻 |
| AI智能体系统利用长期记忆数据库来保存、检索并应用从过去交互中汲取的经验教训。智能体不会将每次提示词都视为完全孤立的事件,而是会引用历史数据来实现持续的自我迭代与进化,从而防止重蹈覆辙。 | 律师事务所必须具备强大的系统记忆(Corporate Memory)。许多律所目前已经配置了专职的专业支持律师(Professional Support Lawyers, PSLs)以及知识管理系统,用以处理系统化的归档、交割卷宗以及前例共享。
然而,行业的下一个重大突破,很可能将体现在系统化地将过往错误(理想情况下是他人的错误)编纂成册的能力,并在未来瞬间将这些洞察转化为可落地执行的实务智慧。
|
结语
跨学科知识的一个优势在于,它能让我们从另一个知识体系的视角,来审视自身所处的知识系统。当今世界最具创新性的架构思维正高度汇聚于 AI 工程领域,这为律师提供了一个独特的跨界学习机会。
CFN Lawyers LLP不断精进与优化自身的业务架构,确保执行能力与法律专业高度契合,从而提供卓越的法律服务,精准满足客户不断变化的商业需求。
[i] 选择使用“他”作为代词,是为了指代我亲自使用的智能体;而使用“它”则泛指其他AI智能体。我相信,我的智能体目前尚未拥有“意识”…
[ii] https://www.cfnlaw.com.hk/cn/the-claude-code-leak-and-ip-considerations/
[iii] https://hermes-agent.nousresearch.com/
[iv] See for example https://composio.dev/content/openclaw-vs-hermes-agent
[v] 当然,OpenClaw 在工具选择和使用方面也表现出色。这两个平台的技术对比不在本文的讨论范围内。
[vi] 我可能没有完全公平地评价 OpenClaw,但确实有过一次这样的经历:大约在两小时内,我的 OpenClaw 智能体因陷入某个执行循环而被触发,导致我耗掉 30多万个token。如果不手动停止,将会是一场灾难。
[vii] 截至本文撰写时(2026 年 6 月),AI 领域已出现一个新术语“循环工程”(Loop Engineering)。这或许可以作为未来文章的主题。
[viii]由Fareed Khan撰写的《使用Harness Engineering构建Claude代码》,发布于2026年4月7日:https://medium.com/@fareedkhandev/d2e8c0da85f0?sk=f67a164f042bf73b89077b71e8d76370
分享
Other Related Insights & News
聚焦跨境财富规划,启迪法律实务新知—— 曾豪渊律师应邀主讲粤港澳大湾区法律前沿系列讲座
陈冯吴律师事务所有限法律责任合伙拜访北京市安理律师事务所上海及杭州办公室