102: DeepSeek 启动开源周，大模型开源到底在开什么？

本期晚点聊访谈了西北大学 MLL Lab 博士生王子涵，主要讨论了大模型开源的现状和不同层次。访谈首先围绕 DeepSeek 的开源周展开，分析了其开源项目 FlashMLA 对不同开发者的作用，以及算子优化的概念。随后，讨论扩展到开源模型的构成要素，包括技术报告、模型权重、推理框架、训练框架和数据集，并比较了不同公司（如 DeepSeek、Allen AI、EleutherAI）的开源策略差异。最后，王子涵分享了其个人作为开源模型滥用受害者的经历，提醒了开源技术潜在的风险。

Outlines

Part 1: 开场及开源背景

Part 2: DeepSeek开源详解

Part 3: 开源策略与风险

Sign in to continue reading, translating and more.

Continue

晚点聊 LateTalk

Part 1: 开场及开源背景

节目开场及嘉宾介绍

王子涵的学习经历和开源工作

Part 2: DeepSeek开源详解

DeepSeek 开源周及 FlashMLA 解读

算子优化详解及社区反馈

开源 Github 页面解读及库的概念

大模型开源的层次和要素

Part 3: 开源策略与风险

DeepSeek 开源策略及不同公司开源策略对比

开源的额外工作、开源潮流及潜在风险

102: DeepSeek 启动开源周，大模型开源到底在开什么？

晚点聊 LateTalk

Part 1: 开场及开源背景

00:04节目开场及嘉宾介绍

节目开场及嘉宾介绍

02:18王子涵的学习经历和开源工作

王子涵的学习经历和开源工作

Part 2: DeepSeek开源详解

05:02DeepSeek 开源周及 FlashMLA 解读

DeepSeek 开源周及 FlashMLA 解读

10:41算子优化详解及社区反馈

算子优化详解及社区反馈

17:13开源 Github 页面解读及库的概念

开源 Github 页面解读及库的概念

22:31大模型开源的层次和要素

大模型开源的层次和要素

Part 3: 开源策略与风险

31:02DeepSeek 开源策略及不同公司开源策略对比

DeepSeek 开源策略及不同公司开源策略对比

43:01开源的额外工作、开源潮流及潜在风险

开源的额外工作、开源潮流及潜在风险