Prev
NextAI 基礎設施已從 GPU 算力導向轉向記憶體導向,隨著推論成為 AI 的主要工作負載,記憶體容量與頻寬成為系統效能的關鍵瓶頸。美光資深副總裁 Jeremy Werner 與 Mark Montierth 指出,AI Agent 的普及要求系統處理更長的上下文(Context),若缺乏足夠的記憶體支援,將導致 GPU 必須重複運算,造成能源與效能浪費。透過與 GPU 廠商深度協同設計(Co-design)及製程微縮,能有效提升能源效率。此外,Edge AI 的興起將推動手機、車用與機器人等邊緣裝置對高效能、低功耗記憶體的需求,這不僅是技術升級,更將徹底重塑企業的工作流程與生產力模式,使記憶體成為 AI 時代不可或缺的核心基礎。
Outlines
Sign in to continue reading, translating and more.
Open full episode in Podwise