简介

alchemy 系统基于 TensorFlow 框架，开发的一个相对成熟稳定的 KWS（关键词识别）模型微调和部署系统，可以帮助用户微调 KWS 模型以适应特定的应用场景。

核心功能

自动化数据处理: 支持自动读取和生成音频，自动进行预处理和特征提取。
灵活的微调配置: 提供多种模型结构和训练参数选择。
一键微调: 通过简单的配置文件启动微调。
训练监控: 显示训练进度、损失函数变化等。
模型评估: 自动合成测试集，并完成各个版本模型的推理测试。
模型导出: 支持导出 model.pb文件。

快速创建自定义示例工程运行说明

步骤一：拷贝示例工程

第一步：cd 到工作目录，拷贝示例文件夹example_local为自定义的文件夹，这里假设自定义的文件夹为user1_prj。
```
 cd /home/pub/workspace/alchemy
 cp -r example_local user1_prj
 cd user1_prj
```
后续操作都在该user1_prj文件夹下。

步骤二：设置指令词

对于一个项目，最主要的参数有指令词、模型型号、项目输出路径，只要设置好这三个参数就可以了，下面说明这三个参数怎么设置。

第一步：进入到工作目录，打开项目参数设置文件：

    cd /home/pub/workspace/alchemy/user1_prj
    $ vi prj_conf/prj_conf.yaml

    1 project_conf:
    2     work_space: './test_work_space'
    3     project_name: 'TEST_project_local'
    4     gpu_id: 0
    5 model_conf:
    6     model_name: 'model_f'
    7     chip: 'gx8002'
    8 cmd_conf:
    9     main_cmd:
    10         - 小华小华
    11         - 小奥小奥
    12         - 小迪小迪
    13     other_cmd:
    14         - 中速风
    15         - 低速风
    16         - 关闭净化
    17         - 音量最小
    18         - 风扇暂停
    #  备注：暂不支持英文指令词

第二步: 修改项目名称，模型型号,指令词

修改项目名称：将project_name 的值TEST_project_local修改为self_project

修改模型型号：将 model_name 的值model_f 为model_k

修改cmd_conf的汉字为自己需要的指令词，比如修改为如下的样子：

    vi prj_conf/prj_conf.yaml
    1 project_conf:
    2     work_space: './test_work_space'
    3     project_name: 'self_project'
    4     gpu_id: 0
    5 model_conf:
    6     model_name: 'model_k'
    7     chip: 'gx8002'
    8 cmd_conf:
    9     main_cmd:
    10         - 小树同学
    11         - 你好小奥
    12         - 小艺小艺
    13     other_cmd:
    14         - 打开风扇
    15         - 打开消毒
    16         - 打开净化
    17         - 音量最大
    # 备注：暂不支持英文指令词
    # 注意：汉字用中文编辑，但是指令词之间的间隔，以及其他任何标点符号都需要用英文编辑。

注意：以上即完成项目输出路径和模型型号，以及指令词的设置。
如下对不同的模型型号对应不同的模型结构、大小以及解码方式进行简单说明，根据具体需求来选择。目前 alchemy 支持的模型型号，模型大小以及解码方式如下：
- 注意其中model_a 和model_b是模型结构和预训练模型不同，如果需要在150k模型中选择，推荐使用model_b.

步骤三、启动运行脚本

回到主工作目录，打开运行脚本：

 #(进入新创建示例工程主工作目录)
 cd /home/pub/workspace/alchemy/user1_prj
 #(运行脚本)
 bash run_local.sh

经过约十分钟之后，路径/home/pub/workspace/alchemy/user1_prj/test_work_space/project/self_project 下保存项目输出内容。

其他资料

其他详细资料（如调参、定制化模型训练等）可参考：~/workspace/alchemy/docs/V3.2.0

镜像信息

@杭州国芯微

已使用

镜像大小680GB

最近编辑2025-07-15

支持卡型

RTX40系48G RTX40系3080Ti

框架版本

PyTorch-2.3.0

CUDA版本

12.1

应用

JupyterLab: 8888

版本

v3.2

2025-07-15

PyTorch:2.3.0 | CUDA:12.1 | 大小:680.00GB

完成实名即送10元赠金

发文激励活动，领取高额奖金

扫码加入用户交流群