DeepSeek V4 正式发布,推出 1.6T 参数的 Pro 版与极速 Flash 版,标志着国产大模型在算力适配与性能上的重要突破。Pro 版在编程、Agent 能力及世界知识方面表现强劲,其长上下文处理能力在国产模型中极具竞争力,虽在中文创意写作上略显平庸,但整体稳居第一梯队。技术层面,V4 整合了推理与非推理模型,采用 MoE 架构优化成本,并完成了从 CUDA 到华为昇腾框架的底层迁移。尽管受限于国产算力瓶颈导致目前定价较前代有所上涨,但随着下半年昇腾 950 产能释放,价格有望大幅下调。此次发布不仅是性能的迭代,更证明了国产模型在自主算力路径下实现旗舰水平的可行性。
Sign in to continue reading, translating and more.
Continue