控制台
立即注册
baidu-paddle-ocr
ocr模型天花板、支持109种语言、公式、表格、图标
star3
0/小时
v1.0

paddleOCR-VL镜像

镜像简介

百度飞桨PaddleOCR是一款业界领先的OCR与文档理解工具,支持109种语言的精准文字识别,并能高效解析表格、公式及图表等复杂版面。结合视觉场景识别与语义分割能力,它可实现对图像内容的深度理解与结构化提取,适用于文档数字化、多语言信息处理、自动化办公与智能审核等多种场景。

有趣的80后程序员-镜像作者交流群

image

关键步骤说明

1、打开终端

  • 使用该镜像创建实例后,点击进入jupyterlab

image.png

  • jupyterlab中点开终端

image.png

2、进入workspace目录

cd /workspace

3、测试图片

  • 所有测试图片位于input目录

image.png

  • 测试结果位于output目录

一个图片对应一个文件夹,有json与md格式输出

image.png

image.png

  • 建议通过md预览方式查看结果,操作方法如下

image.png

4、cli命令

  • 可通过下面命令对自己的图片进行ocr识别
paddleocr doc_parser -i ./input/eng_complex.png --save_path ./output/eng_complex/
@有趣的80后程序员
有趣的80后程序员认证作者
镜像信息
已使用45
运行时长
104 H
镜像大小
50GB
最后更新时间
2026-02-02
支持卡型
RTX40系
+1
框架版本
PaddlePaddle-3.2
CUDA版本
12.6
应用
JupyterLab: 8888
版本
v1.0
2026-02-02
PaddlePaddle:3.2 | CUDA:12.6 | 大小:50.00GB
logo

隶属于优刻得科技股份有限公司

股票代码:688158

优刻得是中立、安全的云计算服务平台

baidu-paddle-ocr一键部署 | 优云智算