Article

法律大腦的“駕馭工程”

30 June 2026

 

前言

 

如果你的初級助理律師對你說:“我們已經討論了夠多了,確認你想要什麼吧!”,你會如何反應?

 

這正是我的AI智能體在簡短對話後對我的請求的回應:

 

 

是的,我們的確在工作流程設計上來回討論了幾次。可是,哎,它是不是對我有點不耐煩了?

 

即使他[1]確實表現出不耐煩,甚至有點語帶冒犯,我也只能怪我自己。我確實將我的AI智能體設置成了這樣一個助手:“能幫上忙但言辭直率、有自己觀點,在必要時敢於提出不同意見。”活該我被酸!

 

Hermes Agent – 自我進化型AI智能體

 

在我之前的一篇文章中, 我曾分享過使用OpenClaw(俗稱“養龍蝦”的個人化AI智能體)[1]的體驗。上文提到的這位“急躁型”的智能體則是Hermes Agent——Nous Research公司近期推出的個人 AI 智能體系統[1]。它的品牌口號是“與你一同成長的智能體”。基於Hermes Agent系統創建的AI 智能體擁有更優的記憶體/存儲配置,並且能夠在與用戶互動的過程中吸取教訓、總結經驗。這些經驗教訓會存儲在長期記憶檔中,隨著時間推移,智能體能夠憑藉所學內容更好地為你提供協助。

 

根據一些科技評論[1],這種自我進化的特性正是Hermes Agent與OpenClaw的區別所在。即使用戶在運行Hermes Agent和OpenClaw時使用一樣的大語言模型(LLM)(例如兩者均使用GPT-5.5),用戶仍然很可能會認為Hermes Agent 展現出了更強的自我反覆運算與進化能力。

 

從我作為用家對這兩個系統的使用體驗來看,我確實能感受到 Hermes Agent 在底層工程架構上的一些獨特改進。正如其宣傳口號所述,該智能體確實能更主動地保存、檢索並應用記憶體中的記憶知識[1]。此外,Hermes Agent運行非常穩定,目前尚未遇到任何重大缺陷,比如陷入某種未知迴圈或消耗數十萬個token[1]。

 

提示詞工程(Prompt Engineering上下文工程(  Context Engineering 駕馭工程(Harness Engineering[1]

 

圍繞大語言模型進行設計與架構優化,使其成為可實際使用的AI 智慧體的技術方法被稱為駕馭工程(Harness Engineering。我見過一個非常簡潔的定義如下:

 

駕馭工程Harness Engineering)是關於構建AI模型周圍環境的學問,而不是關於構建模型本身。模型負責推理與決策;而駕馭系統則負責執行、約束和連接。一個設計良好的駕馭系統僅向模型提供其所需的精確工具,並嚴格限定其使用權限[1]

 

“Harness”這個詞本身就形象地描述了這項工程的本質。大語言模型就像一匹強大的馬,能夠以最高速度奔跑數英里而不顯疲憊。然而,如果沒有馬具(Harness),這匹馬就只能是一匹野馬,而無法成為賽馬或戰馬。馬具是人類用來駕馭強大力量的工具,使這種力量得以被控制,為人類所用。

 

大語言模型猶如一個極度聰明的大腦:當你在聊天視窗中向其提問時(在技術術語中,這被稱為提示詞工程,Prompt Engineering),它會給出精准且富有智慧的回答。然而,幻覺(hallucination)是大語言模型常見的問題之一——有時其輸出的答案看似正確且置信度極高,但最終往往缺乏依據。

 

若你先向大語言模型輸入若干文檔,並基於這些文檔進行提問,那麼你便為模型提供可靠的語境(在技術術語中,這被稱為上下文工程,Context Engineering)。經過對這些文檔的分析處理後,模型回答問題時出現偏差的概率將顯著降低——前提是您在提問時也會提示它參考相關文檔。

 

駕馭工程(Harness Engineering則將這一過程提升到了全新高度。對於像 Hermes Agent 這樣複雜的 AI 智能體系統,軟件工程師需要為這個聰明的“大腦”構建“血肉與軀幹”,從而讓整個系統能夠作為一個表現穩定、可預測且高度實用的助手來運轉。就像一個真正的機器人一樣,該智能體能夠接收指令、攝取並解讀數據、通過分步推理制定計劃,並最終執行任務。此時,智能體的輸出不再局限于文本回復,而是可以轉化為各種成果檔(Artifacts),如word文檔、excel表格、ppt文稿、圖像或視頻。

 

對律師進行駕馭工程

 

在香港,成為一名合格執業律師的必經之路,恰恰與 AI 的駕馭工程過程不謀而合。第一步是取得法學學位,這為法律思維奠定基礎;隨後通過法學專業證書課程(P.C.LL.)的專業培訓,使法律畢業生掌握成為執業律師所需的實踐技能;此後,事務律師(Solicitor)的實習期(Training Solicitor)或大律師(Barrister)的大律師實習(Pupillage),則在實操層面上提供了更深一層的錘煉。

 

不僅如此,駕馭工程領域的某些理念確實能揭示如何將律師打磨成一件有用的工具:

 

1. 智能體循環(又稱 ReAct 迴圈:推理-行動-觀察)
駕馭工程概念 法律行業比喻
智能體循環(Agentic loop)是構建 AI 智能體的底層框架:

 

i.  智能體對問題進行推理(Reason);

ii. 架構通過調用工具執行行動(Act);

iii. 架構觀察(Observe)現實世界的回饋,並在下一次對話迴圈中更新智能體的狀態。

傳統律師的工作模式往往是線性的:他們接收客戶指令,把自己關在辦公室裡,獨自完成一整塊龐大的法律工作,然後將最終成品交付給客戶。

在瞬息萬變之商業環境中,律師必須打破這種“閉門造車”的孤島模式。通過引入即時回饋與反覆運算調整的持續迴圈機制,方能確保法律服務與客戶不斷變化的商業現實保持高度契合。

 

2. 主控智能體與子智能體架構Orchestrating Agent & Sub-Agents Architecture
駕馭工程概念 法律行業比喻
在複雜的AI智能體系統中,主控智慧體(Orchestrator Agent)負責統攬全域,理解宏觀目標、系統約束以及使用者的最終意圖。核心協同智能體不處理具體的髒活累活,而是衍生出多個執行子智能體(Worker Sub-Agents)去執行特定的、彼此隔離的任務(例如研究特定課題、編寫特定代碼)。

 

子智能體本身不具備全域上下文。除非主控智能體向其傳遞相關參數(技術術語稱為:上下文注水/資料填充 Context Hydration),否則子智能體就會產生幻覺或返回無效資料。最後,當各子智能體返回相互衝突的輸出時,核心協同智能體將運行合成與解決迴圈(Synthesis and Resolution Loop),將資料調和並統一為一份連貫的最終答覆。

 

這完美鏡像了律師事務所合夥人(主控智能體)與助理律師(子智能體)之間的協作動態。合夥人掌握著全域上下文——客戶的商業驅動因素、法官的性情偏好以及整體的宏觀策略。

 

由於助理律師缺乏這種鳥瞰全域的視野,團隊的整體效率便完全取決於合夥人能否精准地為其“注入(hydrate)”所需的上下文背景。合夥人提供這些背景資訊亦極大有助於助理律師的成長,因為“為什麼做(Why)”往往決定了“怎麼做(How)”以及“做什麼(What)”。

 

正如AI的駕馭工程,合夥人或資深律師需要對助理律師的工作成果進行提煉合成,並在發現任何衝突的調查結果時予以協調解決。

 

3. 會話上下文隔離Session Context Isolation
駕馭工程概念 法律行業比喻
大語言模型具備生成和檢查代碼的能力。但在生成一段複雜的代碼後,它會在內部形成一條固定的“推理路徑”。如果讓同一個大語言模型會話去尋找這段代碼中的 漏洞,它幾乎註定會失敗。原因在於該會話已深陷於自身的上下文歷史(Context History)中。它在讀取自己的邏輯時,會預設初始前提完全正確,從而陷入 AI 的證實偏差(Confirmation Bias)。

 

為了解決這一問題,架構工程師採用了“環節上下文隔離”技術。他們將生成的代碼注入到一個完全空白、獨立的“覆核 AI(Reviewer AI)”中。該 AI 只接觸原始輸出,並根據客觀標準對其進行評估。由於它與生成代碼的環節相互隔離,因此能夠瞬間揪出邏輯漏洞。

 

律師同樣極易陷入這種完全相同的心理陷阱。如果一名律師連續 12 個小時在起草一份長達 80 頁的複雜商業租賃合同,他們的大腦就會對這份檔形成一種固化的思維導圖。當他們開始自行校對成果時,他們看到的並不是頁面上實際寫了什麼,而是他們認為自己寫了什麼。他們被困在了自己的“會話上下文”中。

 

因此,強制執行獨立同業覆核(Independent Peer-Review),對於打破起草者證實偏差實在必不可少。在法律檔起草過程中,引入“檢查員/校對員”體系至關重要。

4. 模組化工具調用Modular Tool-Use
駕馭工程概念 法律行業比喻
工具調用(Tool-use)是賦予AI智能體強大擴展性的核心特徵。工具是完全獨立、模組化的代碼片段,擁有嚴格且標準化的輸入/輸出介面大語言模型不需要將這些工具硬編碼在自己的“大腦”中。例如,如果大語言模型經推理認為需要進行網路搜索,它只需直接調用現成的網路搜索工具即可。由於這些工具與核心解耦,開發人員可以隨時升級、更換或添加新工具,而無需重寫大語言模型的核心。 傳統的法律作業往往是“單體式”的。律師或律所傾向於將每個案件視為一個完全定制、渾然一體的獨立宇宙,導致同一個人不得不同時應付深度法律研究、客戶關係管理、海量檔案格式調整以及商業談判。這種模式效率極低。

 

而模組化的法律作業則將律所集體的專業知識拆解為清晰、可複用的“工具箱”。這使得精幹的核心團隊能夠根據不同客戶的預算和需求,靈活動態地組合出量身定制的解決方案。那些將法律服務結構化為“隨插即用型模組”、而非將其視為某種單一且不透明手藝的律所,將在競爭中保持敏捷與高度的規模化擴展能力。

 

5. 長期記憶配置 Long-Term Memory Configuration
駕馭工程概念 法律行業比喻
AI智能體系統利用長期記憶資料庫來保存、檢索並應用從過去交互中汲取的經驗教訓。智能體不會將每次提示詞都視為完全孤立的事件,而是會引用歷史資料來實現持續的自我反覆運算與進化,從而防止重蹈覆轍。 律師事務所必須具備強大的系統記憶(Corporate Memory)。許多律所目前已經配置了專職的專業支援律師(Professional Support Lawyers, PSLs)以及知識管理系統,用以處理系統化的歸檔、交割卷宗以及前例共用。

 

然而,行業的下一個重大突破,很可能將體現在系統化地將過往錯誤(理想情況下是他人的錯誤)編纂成冊的能力,並在未來瞬間將這些洞察轉化為可落地執行的實務智慧。

 

 

 

結語

 

跨學科知識的一個優勢在於,它能讓我們從另一個知識體系的視角,來審視自身所處的知識系統。當今世界最具創新性的架構思維正高度彙聚於 AI 工程領域,這為律師提供了一個獨特的跨界學習機會。

 

CFN Lawyers LLP不斷精進與優化自身的業務架構,確保執行能力與法律專業高度契合,從而提供卓越的法律服務,精准滿足客戶不斷變化的商業需求。

 

 

 


[i] 選擇使用“他”作為代詞,是為了指代我親自使用的智能體;而使用“它”則泛指其他AI智能體。我相信,我的智能體目前尚未擁有“意識”…

[ii] https://www.cfnlaw.com.hk/tc/the-claude-code-leak-and-ip-considerations/

[iii] https://hermes-agent.nousresearch.com/

[iv] See for example https://composio.dev/content/openclaw-vs-hermes-agent

[v] 當然,OpenClaw 在工具選擇和使用方面也表現出色。這兩個平臺的技術對比不在本文的討論範圍內。

[vi] 我可能沒有完全公平地評價 OpenClaw,但確實有過一次這樣的經歷:大約在兩小時內,我的 OpenClaw 智能體因陷入某個執行迴圈而被觸發,導致我耗掉 30多萬個token。如果不手動停止,將會是一場災難。

[vii] 截至本文撰寫時(2026 年 6 月),AI 領域已出現一個新術語“迴圈工程”(Loop Engineering)。這或許可以作為未來文章的主題。

[viii] 由Fareed Khan撰寫的《使用Harness Engineering構建Claude代碼》,發佈於2026年4月7日: https://medium.com/@fareedkhandev/d2e8c0da85f0?sk=f67a164f042bf73b89077b71e8d76370