主持人哈利在節目《科技浪》中,討論 DeepSeek OCR 論文及其對大型語言模型(LLM)的潛在影響。他指出,DeepSeek OCR 雖然名稱為 OCR 模型,但其核心重點在於探討文字壓縮,特別是如何利用圖像 token 來更有效地壓縮文字。哈利解釋了 OCR 技術的背景及其在日常生活的應用,並強調 DeepSeek OCR 的獨特之處使其在業界引起廣泛關注。他將節目內容分為三部分:運作原理、模型成效以及這項技術可能帶來的典範轉移。節目試聽部分詳細介紹了 DeepSeek OCR 模型的 Encoder 和 Decoder 架構,以及它們如何將圖像轉換為 Vision Token 並由 LLM 進行辨識。
Sign in to continue reading, translating and more.
Continue