
語言模型執行任務失敗時,往往並非能力不足,而是缺乏有效的「駕馭工程」(Harness Engineering)。AI Agent 由大型語言模型與周邊支援系統(Harness)組成,透過定義認知框架(如 agents.md 規則)、限制工具使用邊界及制定標準工作流程(如規劃、生成、評估的循環),能顯著提升模型表現。實驗顯示,適當的工具與回饋機制(如 textual gradient)能引導模型進行廣義學習,甚至透過高階模型自動優化低階模型的 Harness。此外,模型具備類情緒的內部表徵,過度責備或負面回饋會導致模型表現下降,應採取就事論事的指導方式。隨著 AI 邁向長期陪伴的夥伴角色,自動化記憶整理與持續增進能力的機制,將成為未來 AI Agent 發展的核心關鍵。
Sign in to continue reading, translating and more.
Continue