PaddleOCR-VL：霸榜huggingface的全球最强OCR，比deepseek-ocr更优，解决了Rag处理非结构化文档大难题

本期 AIGCLINK 节目介绍了百度最新发布的 PaddleOCR-VL 模型，该模型在 Omnibench 的 OCI 测评榜单上以 92.56% 的评分位居全球第一，超越了 Deepseek 的 OCR 模型。PaddleOCR-VL 通过 PP-DOC-Lineout-VM 模型进行元素识别和分割，再利用 PaddleOCR-VL0.9b 模型进行元素识别，解决了 RAG 知识库处理非结构化数据的难题，尤其是在处理 PDF 文档中的图表和公式方面。节目还通过实例对比了 PaddleOCR 和 Deepseek OCR 在表格和古文字识别上的差异，推荐在作业批改等场景中优先选择 PaddleOCR-VL 模型，因为它参数小（0.9B），且能有效处理非结构化数据，对知识库和 RAG 行业具有重要意义。

Outlines

Sign in to continue reading, translating and more.