登录
AI短视频生成系统ai视频ai语音合成si视频创作系统 构建by科哥
零门槛,零剪辑经验,让视频创作成为一句话的事
star0
0/小时
v1.1
最新

注意:此镜像使用的是无卡模式运行,新建镜像之后,请关机,再使用无卡模式运行即可

api中转站全球最卷

运行使用界面截图

image.png

image.png

image.png

image.png


Pixelle-Video 用户使用手册

⚡ AI 全自动短视频引擎 - 让视频创作成为一句话的事


📖 目录

  1. 快速开始
  2. 界面介绍
  3. 基础功能
  4. 高级功能
  5. 常见问题
  6. 技巧与建议

🚀 快速开始

启动应用

在项目根目录运行启动脚本:

./start_app.sh

启动成功后,浏览器会自动打开 http://localhost:7860

首次配置

首次使用需要配置 AI 服务:

  1. 展开页面顶部的 "⚙️ 系统配置" 面板
  2. 配置 LLM(大语言模型)
    • 选择预设模型(推荐:通义千问)
    • 填入 API Key
    • 点击测试连接
  3. 配置 图像生成服务(可选):
    • 本地部署:填写 ComfyUI URL
    • 云端服务:填写 RunningHub API Key
  4. 点击 "保存配置"

🎨 界面介绍

主界面布局

┌─────────────────────────────────────────────────┐
│  ⚡ Pixelle-Video - AI 全自动短视频引擎          │  ← 标题栏
│           Pixelle.AI 提供支持                    │
│     webUI二次开发by 科哥 微信:312088415         │
└─────────────────────────────────────────────────┘
                [语言选择器]                         ← 语言切换

┌─────────────────────────────────────────────────┐
│  ⚙️ 系统配置                                     │  ← 配置面板
└─────────────────────────────────────────────────┘

┌──────────┬──────────┬──────────┐
│ 🎬 标准模式 │ 📝 自定义文案 │ 📸 素材模式 │  ← 功能标签页
└──────────┴──────────┴──────────┘

[主要工作区域]                                      ← 内容区

功能标签页

  • 🎬 标准模式:输入主题,AI 自动生成完整视频
  • 📝 自定义文案:使用自己的文案生成视频
  • 📸 素材模式:上传图片/视频,AI 生成解说视频

📝 基础功能

1. 标准模式 - AI 自动生成

适用场景:快速生成视频,让 AI 创作文案

操作步骤

第一步:输入主题

左侧栏 → 📝 视频脚本
- 选择 "AI 生成内容"
- 输入主题,例如:
  ✓ "如何提高学习效率"
  ✓ "冬日暖阳"
  ✓ "为什么要养成阅读习惯"

第二步:选择背景音乐

左侧栏 → 🎵 背景音乐
- 无 BGM:纯人声解说
- 内置音乐:选择预置音乐
- 自定义音乐:上传自己的音乐文件

第三步:配置语音

中间栏 → 🎤 配音合成
- 选择 TTS 工作流(推荐:Edge TTS)
- 可选:上传参考音频进行声音克隆
- 点击 "预览语音" 试听效果

第四步:配置视觉

中间栏 → 🎨 插图生成
- 选择图像生成工作流
- 设置图像尺寸(默认 1024x1024)
- 输入提示词前缀(控制画面风格)
- 选择视频模板(竖屏/横屏/方形)

第五步:生成视频

右侧栏 → 🎬 视频生成
- 点击 "🎬 生成视频" 按钮
- 等待生成完成(显示实时进度)
- 预览并下载视频

示例

主题:为什么要养成阅读习惯

生成流程

  1. AI 自动创作 5-8 个分镜的文案
  2. 为每个分镜生成配图
  3. 合成语音解说
  4. 添加背景音乐
  5. 合成最终视频

预计时间:2-5 分钟(取决于分镜数量和网络速度)


2. 自定义文案模式

适用场景:已有现成文案,直接生成视频

操作步骤

第一步:输入文案

左侧栏 → 📝 视频脚本
- 选择 "固定文案内容"
- 粘贴或输入完整文案
- 文案会自动分段(每段对应一个分镜)

第二步至第五步:与标准模式相同

文案格式建议

每段文案对应一个视频分镜。
建议每段 20-50 字。

示例:
阅读是一种习惯,更是一种力量。
它能让我们在忙碌的生活中找到片刻宁静。
每天坚持阅读30分钟,一年就能读完12本书。
知识的积累,就是这样一点一滴完成的。

3. 素材模式 - 上传图片/视频

适用场景:使用自己的照片/视频制作解说视频

操作步骤

第一步:上传素材

左侧栏 → 📸 素材上传
- 点击 "上传素材文件"
- 支持格式:JPG, PNG, MP4, MOV 等
- 可上传多个文件

第二步:输入创作意图

左侧栏 → 💡 创作意图
- 描述你想表达的主题
- 例如:"这是我的旅行照片,帮我生成一个温馨的旅行回忆视频"

第三步:AI 分析素材

- AI 自动识别图片内容
- 理解视频场景
- 生成匹配的文案和旁白

第四步至第五步:与标准模式相同


🎯 高级功能

1. 声音克隆

功能:使用参考音频克隆声音

步骤

  1. 选择支持声音克隆的 TTS 工作流(如 Index-TTS)
  2. 上传参考音频(MP3/WAV/FLAC)
  3. 参考音频要求:
    • 时长:10-30 秒
    • 音质清晰,无背景噪音
    • 单人说话
  4. 点击 "预览语音" 测试效果

2. 自定义视觉风格

功能:控制 AI 生成图片的风格

步骤

  1. 在 "提示词前缀" 中输入风格描述(英文)
  2. 示例风格:
    极简黑白火柴人风格:
    Minimalist black-and-white matchstick figure style, clean lines, simple sketch style
    
    水彩画风格:
    Watercolor painting style, soft colors, artistic brush strokes
    
    赛博朋克风格:
    Cyberpunk style, neon lights, futuristic cityscape, dark atmosphere
    
  3. 点击 "预览风格" 测试效果

3. 视频模板选择

功能:选择不同的视频布局和设计

模板类型

  • static_*.html:静态模板(纯文字)
  • image_*.html:图片模板(AI 生成图片)
  • video_*.html:视频模板(AI 生成视频)

尺寸选择

  • 竖屏(9:16):适合抖音、快手
  • 横屏(16:9):适合 B 站、YouTube
  • 方形(1:1):适合微信朋友圈

4. 批量生成

功能:一次创建多个视频任务

步骤

  1. 配置好第一个视频的所有参数
  2. 点击 "批量生成" 按钮
  3. 输入多个主题(每行一个)
  4. 系统自动排队生成

❓ 常见问题

Q1: 生成视频需要多久?

A: 取决于多个因素:

  • 分镜数量:5 个分镜约 2-3 分钟
  • 网络速度:影响 AI 调用速度
  • 服务类型:
    • 本地 ComfyUI:更快
    • 云端服务:取决于网络

Q2: 视频效果不满意怎么办?

A: 可以尝试:

  1. 文案不满意
    • 更换 LLM 模型(不同模型风格不同)
    • 使用自定义文案模式
  2. 配图不满意
    • 调整提示词前缀
    • 更换图像生成工作流
    • 调整图像尺寸
  3. 语音不满意
    • 更换 TTS 工作流
    • 上传参考音频克隆声音
    • 调整语速
  4. 布局不满意
    • 更换视频模板

Q3: 费用大概多少?

A: 完全支持免费运行!

免费方案

  • LLM:使用 Ollama(本地运行)
  • 图像:ComfyUI 本地部署
  • 成本:0 元

推荐方案

  • LLM:通义千问(成本极低)
  • 图像:ComfyUI 本地部署
  • 成本:约 0.01-0.05 元/视频

云端方案

  • LLM:OpenAI GPT-4
  • 图像:RunningHub
  • 成本:约 0.5-2 元/视频

Q4: 如何获取 API Key?

通义千问

  1. 访问 https://dashscope.aliyun.com
  2. 注册并登录
  3. 进入 API-KEY 管理
  4. 创建新的 API Key

RunningHub

  1. 访问 https://www.runninghub.cn/?inviteCode=06kjlln6
  2. 注册并登录
  3. 进入个人中心
  4. 获取 API Key

Q5: 视频保存在哪里?

A: 所有生成的视频保存在 output/ 目录下

文件命名

  • 格式:{主题}_{时间戳}_final.mp4
  • 例如:如何提高学习效率_20251222_143025_final.mp4

中间文件

  • *_narrations.json:生成的文案
  • *_frame_*.png:渲染的帧图片
  • *_audio_*.mp3:生成的音频

Q6: 如何查看历史记录?

A: 点击顶部导航栏的 "📚 History" 标签页

功能

  • 查看所有生成过的视频
  • 预览视频
  • 下载视频
  • 删除视频

💡 技巧与建议

创作技巧

1. 主题选择

  • ✅ 具体明确:"如何提高学习效率"
  • ❌ 过于宽泛:"学习"

2. 文案撰写

  • 每段 20-50 字为宜
  • 语言简洁,避免长句
  • 适当使用排比、对比等修辞

3. 风格统一

  • 同一系列视频使用相同的:
    • 提示词前缀
    • 视频模板
    • TTS 工作流

4. 音乐选择

  • 知识科普:轻音乐、钢琴曲
  • 情感类:抒情音乐
  • 励志类:节奏感强的音乐

性能优化

1. 本地部署优先

  • 有显卡:部署本地 ComfyUI
  • 速度更快,成本更低

2. 批量生成

  • 一次生成多个视频
  • 充分利用 API 配额

3. 缓存利用

  • 相似主题的视频可以复用配置
  • 保存常用的提示词前缀

质量提升

1. 多次尝试

  • AI 生成有随机性
  • 不满意可以重新生成

2. 参考优秀作品

  • 观察热门视频的文案结构
  • 学习优秀的视觉风格

3. 迭代优化

  • 记录每次生成的参数
  • 总结哪些配置效果好

📞 技术支持

遇到问题?

  1. 查看 常见问题 章节
  2. 查看项目 Issues:https://github.com/AIDC-AI/Pixelle-Video/issues
  3. 联系开发者:
    • 科哥微信:312088415
    • 项目维护者:Pixelle.AI 团队

反馈建议?

欢迎提交 Issue 或 Pull Request!


📄 许可证

本项目采用 Apache 2.0 许可证


祝你创作愉快!🎉

最后更新:2025-12-22

bug反馈可以加入科哥专属群交流➕ 广告勿进!

描述图片内容

优云镜像使用操作一般流程:

1、在社区镜像区域,选择镜像:

image.png

2、在打开的新页面 点击“使用该镜像创建实例”:

image.png

3、选择一个合适的显卡【GPU】根据情况选择:

image.png

4、确认部署信息无误,点击“开始部署”,然后等待部署完成:

image.png

如何启动应用

不是自动运行的应用:

1、手动点击加号新建起始页:

image.png

2、打开终端:

image.png

3、输入指令然后回车:

image.png

4、等待加载模型完毕:

image.png

5、看到这个出现:

image.png

image.png

6、返回控制面板打开“SD-WebUI”

image.png image.png

手动运行方法2:

image.png

重新启动: image.png

查看启动进度:

image.png

然后:返回控制面板打开“SD-WebUI”

image.png image.png

打开webUI使用应用 :

image.png

jupyterlab查看进度和生成的时间等:

image.png

如果是自动开机启动

只要等待部署完成✅ ,打开“SD-WebUI”即可

image.png

以上都是镜像运行打开操作的一般步骤

优其他使用报错问题加群咨询

更多高级指令,可以进入jupyterlab,自行操作,例如:

  • 查看进程:
ps -ef |grep python
  • 终止进程:
kill -9 pid
  • 重启程序:
cd  /root && bash run.sh

有bug请微信科哥或加群: 312088415

科哥在UCloud镜像列表【不断更新中】:

image.png

@科哥AIGC
科哥AIGC认证作者
镜像信息
已使用0
运行时长
0 H
支持自启动
镜像大小
30GB
最后更新时间
2025-12-23
支持卡型
3080TiRTX50系RTX40系48G RTX40系2080Ti30902080A800H20P40A100
+11
框架版本
PyTorch-2.4
CUDA版本
12.4
应用
JupyterLab: 8888
版本
v1.1
2025-12-23
PyTorch:2.4 | CUDA:12.4 | 大小:30.00GB