PaddleOCR-VL：霸榜huggingface的全球最强OCR，比deepseek-ocr更优，解决了Rag处理非结构化文档大难题

本期 AIGCLINK 节目介绍了百度最新发布的 PaddleOCR-VL 模型，该模型在 Omnibench 的 OCI 测评榜单上以 92.56% 的评分位居全球第一，超越了 Deepseek 的 OCR 模型。PaddleOCR-VL 通过 PP-DOC-Lineout-VM 模型进行元素识别和分割，再利用 PaddleOCR-VL0.9b 模型进行元素识别，解决了 RAG 知识库处理非结构化数据的难题，尤其是在处理 PDF 文档中的图表和公式方面。节目还通过实例对比了 PaddleOCR 和 Deepseek OCR 在表格和古文字识别上的差异，推荐在作业批改等场景中优先选择 PaddleOCR-VL 模型，因为它参数小（0.9B），且能有效处理非结构化数据，对知识库和 RAG 行业具有重要意义。

Outlines

Sign in to continue reading, translating and more.

Open full episode in Podwise

AIGCLINK

PaddleOCR-VL 模型介绍及其行业价值

PaddleOCR-VL 模型与 DeepSeek OCR 的对比

PaddleOCR-VL 模型的技术架构

PaddleOCR-VL 模型在作业批改中的应用及测评准备

PaddleOCR-VL 模型与 DeepSeek OCR 的表格识别对比

PaddleOCR-VL 模型在花体字识别上的预测及总结

PaddleOCR-VL：霸榜huggingface的全球最强OCR，比deepseek-ocr更优，解决了Rag处理非结构化文档大难题

AIGCLINK

00:00PaddleOCR-VL 模型介绍及其行业价值

PaddleOCR-VL 模型介绍及其行业价值

01:12PaddleOCR-VL 模型与 DeepSeek OCR 的对比

PaddleOCR-VL 模型与 DeepSeek OCR 的对比

02:20PaddleOCR-VL 模型的技术架构

PaddleOCR-VL 模型的技术架构

05:10PaddleOCR-VL 模型在作业批改中的应用及测评准备

PaddleOCR-VL 模型在作业批改中的应用及测评准备

07:08PaddleOCR-VL 模型与 DeepSeek OCR 的表格识别对比

PaddleOCR-VL 模型与 DeepSeek OCR 的表格识别对比

09:58PaddleOCR-VL 模型在花体字识别上的预测及总结

PaddleOCR-VL 模型在花体字识别上的预测及总结