本期 AIGCLINK 节目介绍了百度最新发布的 PaddleOCR-VL 模型,该模型在 Omnibench 的 OCI 测评榜单上以 92.56% 的评分位居全球第一,超越了 Deepseek 的 OCR 模型。PaddleOCR-VL 通过 PP-DOC-Lineout-VM 模型进行元素识别和分割,再利用 PaddleOCR-VL0.9b 模型进行元素识别,解决了 RAG 知识库处理非结构化数据的难题,尤其是在处理 PDF 文档中的图表和公式方面。节目还通过实例对比了 PaddleOCR 和 Deepseek OCR 在表格和古文字识别上的差异,推荐在作业批改等场景中优先选择 PaddleOCR-VL 模型,因为它参数小(0.9B),且能有效处理非结构化数据,对知识库和 RAG 行业具有重要意义。
Sign in to continue reading, translating and more.
Continue