Computer Use 是当前最被低估的 AI 核心能力,它通过模拟人类视觉和键鼠操作,解决了 80% 缺乏 API 接口的传统软件自动化难题。OpenAI Codex App 近期实现了多 Agent 后台并行且不干扰用户操作,而 Claude Opus 4.7 则通过显著提升视觉分辨率,将任务成功率从一年半前的 14.9% 推高至 78%。然而,该技术目前仍存在三大瓶颈:高清截图导致的高昂 Token 成本、推理循环造成的执行缓慢,以及 22% 的错误率导致在支付或删除等关键任务中仍需人工干预。虽然尚非完美的生产力工具,但其打破软件孤岛的潜力使其成为未来一两年内最具想象力的 AI 应用方向。
Sign in to continue reading, translating and more.
Continue