24 Oct 2025
7m

【試聽】XEP17 - DeepSeek 再度引起熱議!解讀 DeepSeek OCR 論文--LLM典範轉移的可能性?

Podcast cover

科技浪 Tech.wav

主持人哈利在節目《科技浪》中,討論 DeepSeek OCR 論文及其對大型語言模型(LLM)的潛在影響。他指出,DeepSeek OCR 雖然名稱為 OCR 模型,但其核心重點在於探討文字壓縮,特別是如何利用圖像 token 來更有效地壓縮文字。哈利解釋了 OCR 技術的背景及其在日常生活的應用,並強調 DeepSeek OCR 的獨特之處使其在業界引起廣泛關注。他將節目內容分為三部分:運作原理、模型成效以及這項技術可能帶來的典範轉移。節目試聽部分詳細介紹了 DeepSeek OCR 模型的 Encoder 和 Decoder 架構,以及它們如何將圖像轉換為 Vision Token 並由 LLM 進行辨識。

Outlines

Sign in to continue reading, translating and more.

Open full episode in Podwise