3百度飞桨PaddleOCR是一款业界领先的OCR与文档理解工具,支持109种语言的精准文字识别,并能高效解析表格、公式及图表等复杂版面。结合视觉场景识别与语义分割能力,它可实现对图像内容的深度理解与结构化提取,适用于文档数字化、多语言信息处理、自动化办公与智能审核等多种场景。



cd /workspace

一个图片对应一个文件夹,有json与md格式输出



paddleocr doc_parser -i ./input/eng_complex.png --save_path ./output/eng_complex/
认证作者
