Harness Engineering：有時候語言模型不是不夠聰明，只是沒有人類好好引導

語言模型執行任務失敗時，往往並非能力不足，而是缺乏有效的「駕馭工程」（Harness Engineering）。AI Agent 由大型語言模型與周邊支援系統（Harness）組成，透過定義認知框架（如 agents.md 規則）、限制工具使用邊界及制定標準工作流程（如規劃、生成、評估的循環），能顯著提升模型表現。實驗顯示，適當的工具與回饋機制（如 textual gradient）能引導模型進行廣義學習，甚至透過高階模型自動優化低階模型的 Harness。此外，模型具備類情緒的內部表徵，過度責備或負面回饋會導致模型表現下降，應採取就事論事的指導方式。隨著 AI 邁向長期陪伴的夥伴角色，自動化記憶整理與持續增進能力的機制，將成為未來 AI Agent 發展的核心關鍵。

Outlines

Sign in to continue reading, translating and more.