镜像社区
部署GPU实例
文档中心
常见问题(FAQ)
其他
alchemy_env_202507151323
用于训练alchemy kws模型
0/小时
v3.2

简介

alchemy 系统基于 TensorFlow 框架,开发的一个相对成熟稳定的 KWS(关键词识别)模型微调和部署系统,可以帮助用户微调 KWS 模型以适应特定的应用场景。

核心功能

  • 自动化数据处理: 支持自动读取和生成音频,自动进行预处理和特征提取。
  • 灵活的微调配置: 提供多种模型结构和训练参数选择。
  • 一键微调: 通过简单的配置文件启动微调。
  • 训练监控: 显示训练进度、损失函数变化等。
  • 模型评估: 自动合成测试集,并完成各个版本模型的推理测试。
  • 模型导出: 支持导出 model.pb文件。

快速创建自定义示例工程运行说明

步骤一:拷贝示例工程

  • 第一步:cd 到工作目录,拷贝示例文件夹example_local为自定义的文件夹,这里假设自定义的文件夹为user1_prj。

     cd /home/pub/workspace/alchemy
     cp -r example_local user1_prj
     cd user1_prj
    
  • 后续操作都在该user1_prj文件夹下。

步骤二:设置指令词

  • 对于一个项目,最主要的参数有指令词模型型号项目输出路径,只要设置好这三个参数就可以了,下面说明这三个参数怎么设置。

  • 第一步:进入到工作目录,打开 项目参数设置文件:

        cd /home/pub/workspace/alchemy/user1_prj
        $ vi prj_conf/prj_conf.yaml
    
        1 project_conf:
        2     work_space: './test_work_space'
        3     project_name: 'TEST_project_local'
        4     gpu_id: 0
        5 model_conf:
        6     model_name: 'model_f'
        7     chip: 'gx8002'
        8 cmd_conf:
        9     main_cmd:
        10         - 小华小华
        11         - 小奥小奥
        12         - 小迪小迪
        13     other_cmd:
        14         - 中速风
        15         - 低速风
        16         - 关闭净化
        17         - 音量最小
        18         - 风扇暂停
        #  备注:暂不支持英文指令词
    
  • 第二步: 修改项目名称,模型型号,指令词

    修改项目名称:将project_name 的值TEST_project_local修改为self_project

    修改模型型号:将 model_name 的值model_fmodel_k

    修改cmd_conf的汉字为自己需要的指令词,比如修改为如下的样子:

        vi prj_conf/prj_conf.yaml
        1 project_conf:
        2     work_space: './test_work_space'
        3     project_name: 'self_project'
        4     gpu_id: 0
        5 model_conf:
        6     model_name: 'model_k'
        7     chip: 'gx8002'
        8 cmd_conf:
        9     main_cmd:
        10         - 小树同学
        11         - 你好小奥
        12         - 小艺小艺
        13     other_cmd:
        14         - 打开风扇
        15         - 打开消毒
        16         - 打开净化
        17         - 音量最大
        # 备注:暂不支持英文指令词
        # 注意:汉字用中文编辑,但是指令词之间的间隔,以及其他任何标点符号都需要用英文编辑。
    
    
  • 注意:以上即完成项目输出路径和模型型号,以及指令词的设置。

  • 如下对不同的模型型号对应不同的模型结构、大小以及解码方式进行简单说明,根据具体需求来选择。目前 alchemy 支持的模型型号,模型大小 以及解码方式如下:

    • 注意其中model_a 和model_b是模型结构和预训练模型不同,如果需要在150k模型中选择,推荐使用model_b.

步骤三、启动运行脚本

  • 回到主工作目录,打开运行脚本:

     #(进入新创建示例工程主工作目录)
     cd /home/pub/workspace/alchemy/user1_prj
     #(运行脚本)
     bash run_local.sh
    
  • 经过约十分钟之后,路径/home/pub/workspace/alchemy/user1_prj/test_work_space/project/self_project 下保存项目输出内容。

其他资料

其他详细资料(如调参、定制化模型训练等)可参考:~/workspace/alchemy/docs/V3.2.0

镜像信息
@杭州国芯微
已使用
0
镜像大小680GB
最近编辑2025-07-15
支持卡型
RTX40系48G RTX40系3080Ti
+3
框架版本
PyTorch-2.3.0
CUDA版本
12.1
应用
JupyterLab: 8888
版本
v3.2
2025-07-15
PyTorch:2.3.0 | CUDA:12.1 | 大小:680.00GB