江鋆晨: KV Cache，大模型记忆，清华姚班，CMU，教授，开源，视频流媒体

大模型推理效率的核心在于 KV Cache 管理，将其视为模型的 “记忆” 而非临时数据，是降低重复计算成本的关键。江鋆晨提出，AI 基础设施应借鉴互联网发展史，通过解耦推理引擎与存储，构建标准化的 KV Cache 层。从清华姚班到 CMU 再到创立 Tensormesh，这一路径强调了 “做最难的事” 以实现快速成长，并利用开源生态推动技术标准化。通过深入一线工程实践而非仅停留在理论研究，能更敏锐地捕捉行业痛点。这种将学术洞察转化为工业界基础设施的尝试，正试图解决大模型时代算力与存储供需失衡的挑战，为 AI 应用提供更经济高效的底层支撑。

Outlines

Part 1: 背景、愿景与科研方法论

Part 2: 技术演进、流媒体与KV Cache本质

Part 3: 开源生态、创业愿景与解耦趋势

Part 4: 融资经验与职业生涯建议

Sign in to continue reading, translating and more.

Open full episode in Podwise

月球大叔

Part 1: 背景、愿景与科研方法论

AI 时代存储价格暴涨与 KV Cache 的战略价值

愿景驱动的研究方法论与科研中的 “放弃” 艺术

Part 2: 技术演进、流媒体与KV Cache本质

网络视频流媒体的系统优化与大数据应用

大模型推理基础设施的演进与 KV Cache 的本质

Part 3: 开源生态、创业愿景与解耦趋势

开源生态建设与工业界标准制定

Tensormesh 的创业愿景与 AI 基础设施的解耦趋势

Part 4: 融资经验与职业生涯建议

融资历程与师生共同创业的信任机制

职业生涯建议与 AI 时代的科研路径选择

江鋆晨: KV Cache，大模型记忆，清华姚班，CMU，教授，开源，视频流媒体

月球大叔

Part 1: 背景、愿景与科研方法论

00:00AI 时代存储价格暴涨与 KV Cache 的战略价值

AI 时代存储价格暴涨与 KV Cache 的战略价值

12:00愿景驱动的研究方法论与科研中的 “放弃” 艺术

愿景驱动的研究方法论与科研中的 “放弃” 艺术

Part 2: 技术演进、流媒体与KV Cache本质

25:20网络视频流媒体的系统优化与大数据应用

网络视频流媒体的系统优化与大数据应用

40:00大模型推理基础设施的演进与 KV Cache 的本质

大模型推理基础设施的演进与 KV Cache 的本质

Part 3: 开源生态、创业愿景与解耦趋势

1:13:40开源生态建设与工业界标准制定

开源生态建设与工业界标准制定

1:24:20Tensormesh 的创业愿景与 AI 基础设施的解耦趋势

Tensormesh 的创业愿景与 AI 基础设施的解耦趋势

Part 4: 融资经验与职业生涯建议

1:40:00融资历程与师生共同创业的信任机制

融资历程与师生共同创业的信任机制

1:57:00职业生涯建议与 AI 时代的科研路径选择

职业生涯建议与 AI 时代的科研路径选择