语音模块 - Qwen Omni TTS 配置指南 ✨

这个模块，对接的是 Qwen 多模态模型提供的TTS语音合成服务哦！

首先，我们需要先从template_configs/Qwen_omni_template.toml复制一份配置文件模板到configs/Qwen_omni.toml。

toml

api_key = "your_api_key" # API密钥
base_url = "https://dashscope.aliyuncs.com/compatible-mode/v1" # API地址
model_name = "qwen-omni-turbo" # 模型名称
voice_character = "Chelsie" # 音色
media_format = "wav" # 音频格式，请使用wav格式

配置项详解

`api_key` API密钥

这里填写的是 Qwen 服务的 API 密钥。大家需要前往阿里云的 DashScope控制台创建并获取你的API Key。

百灵警告

API Key是你的重要凭证，请妥善保管，不要泄露给他人！

`base_url` API地址

这个是千问服务的API接口地址。通常情况下不需要修改，保持默认的就好啦。

`model_name` 模型名称

这里指定的是使用的模型名称。你可以根据需要选择不同的模型。注意，请一定选用多模态且支持语音输出的模型哦！比如 qwen-omni-turbo 就是一个很好的选择。

`voice_character` 音色

这里可以配置你想要的音色。Qwen 提供了多种不同的音色选项，您可以根据自己的喜好进行选择。

百灵小贴士（2025/05/22版）

目前官方文档给出支持的音色有：

"Cherry" （不支持开源版模型）
"Serena" （不支持开源版模型）
"Ethan"
"Chelsie"

`media_format` 音频格式

这里配置的是使用的音频格式。

现阶段，官方仅支持wav格式，所以请大家根据官方文档进行修改哦~。

语音模块 - Qwen Omni TTS 配置指南 ✨ ​

配置项详解 ​

api_key API密钥 ​

base_url API地址 ​

model_name 模型名称 ​

voice_character 音色 ​