YouTube22 Oct 2025
12m

PaddleOCR-VL:霸榜huggingface的全球最强OCR,比deepseek-ocr更优,解决了Rag处理非结构化文档大难题

Podcast cover

AIGCLINK

本期 AIGCLINK 节目介绍了百度最新发布的 PaddleOCR-VL 模型,该模型在 Omnibench 的 OCI 测评榜单上以 92.56% 的评分位居全球第一,超越了 Deepseek 的 OCR 模型。PaddleOCR-VL 通过 PP-DOC-Lineout-VM 模型进行元素识别和分割,再利用 PaddleOCR-VL0.9b 模型进行元素识别,解决了 RAG 知识库处理非结构化数据的难题,尤其是在处理 PDF 文档中的图表和公式方面。节目还通过实例对比了 PaddleOCR 和 Deepseek OCR 在表格和古文字识别上的差异,推荐在作业批改等场景中优先选择 PaddleOCR-VL 模型,因为它参数小(0.9B),且能有效处理非结构化数据,对知识库和 RAG 行业具有重要意义。

Outlines

Sign in to continue reading, translating and more.

Open full episode in Podwise