Qwen 2.5-Omni是一个端到端的多模态大语言模型,旨在感知包括文本、图像、音频和视频在内的多种模态,同时以流式的方式生成文本和自然语音响应,该镜像推荐使用单卡A100。
建议观看官方的readme https://github.com/QwenLM/Qwen2.5-Omni/blob/main/README_CN.md
cd /workspace/Qwen2.5-Omni
python demo.py
Cookbooks位于/workspace/Qwen2.5-Omni/cookbooks/ 已验证均可运行
注意你需要在ipynb的右上角切换python内核为my-py312