Skip to content

语音模块 - Qwen Omni TTS 配置指南 ✨

这个模块,对接的是 Qwen 多模态模型提供的TTS语音合成服务哦!

首先,我们需要先从template_configs/Qwen_omni_template.toml复制一份配置文件模板到configs/Qwen_omni.toml

toml
api_key = "your_api_key" # API密钥
base_url = "https://dashscope.aliyuncs.com/compatible-mode/v1" # API地址
model_name = "qwen-omni-turbo" # 模型名称
voice_character = "Chelsie" # 音色
media_format = "wav" # 音频格式,请使用wav格式

配置项详解

api_key API密钥

这里填写的是 Qwen 服务的 API 密钥。大家需要前往阿里云的 DashScope控制台 创建并获取你的API Key。

百灵警告

API Key是你的重要凭证,请妥善保管,不要泄露给他人!

base_url API地址

这个是千问服务的API接口地址。通常情况下不需要修改,保持默认的就好啦。

model_name 模型名称

这里指定的是使用的模型名称。你可以根据需要选择不同的模型。注意,请一定选用多模态且支持语音输出的模型哦!比如 qwen-omni-turbo 就是一个很好的选择。

voice_character 音色

这里可以配置你想要的音色。Qwen 提供了多种不同的音色选项,您可以根据自己的喜好进行选择。

百灵小贴士(2025/05/22版)

目前官方文档给出支持的音色有:

  • "Cherry" (不支持开源版模型)
  • "Serena" (不支持开源版模型)
  • "Ethan"
  • "Chelsie"

media_format 音频格式

这里配置的是使用的音频格式。

现阶段,官方仅支持wav格式,所以请大家根据官方文档进行修改哦~。