AI Agent 在代码任务中的成本结构呈现出高度不透明与不可控性。研究表明,此类任务的 Token 消耗主要由输入端主导,输入输出比高达 154:1,且成本波动极大,同一任务的运行成本差异可达 30 倍。Token 消耗增加并不必然提升准确率,反而常因冗余的文件操作导致 “逆测试时间缩放” 现象。模型效率差异显著,GPT-5 系列表现出更优的性价比,而部分模型在面对失败任务时缺乏止损机制,导致资源浪费。此外,无论是人类专家还是模型自身的预测能力均极弱,且普遍存在系统性低估。行业亟需重构定价模式,并优化 Agent 的工具调用与上下文管理策略,以实现成本透明化与高效执行。
Outlines
Sign in to continue reading, translating and more.
Open full episode in Podwise