1本镜像基于DeepSeek团队开源的新一代OCR模型DeepSeek-OCR 2,具备超越传统文字识别的逻辑理解能力,可像人类一样智能解析文档结构、语义关系与版面元素。支持复杂文档、图表及多格式文件的精准识别与结构化提取,适用于智能办公、档案数字化、教育科研及跨模态信息处理等场景,提供更懂内容的智能阅读解决方案。
1.创建实例

2.选择合适的机型,立即部署

3.启动成功后,点击【JupyterLab】

4.进入terminal,输入以下代码
cd DeepSeek-OCR2-master/DeepSeek-OCR2-vllm
python deepseek_ocr2_gradio.py

5.返回实例页面,点击【可视化UI】, 即可使用。

vLLM 方式速度更快,支持批量处理和并发。
# 进入 vLLM 目录
cd DeepSeek-OCR2-master/DeepSeek-OCR2-vllm
# 单图推理(流式输出)
python run_dpsk_ocr2_image.py
# PDF 批量处理
python run_dpsk_ocr2_pdf.py

认证作者