语音模块 - Qwen Omni TTS 配置指南 ✨
这个模块,对接的是 Qwen 多模态模型提供的TTS语音合成服务哦!
首先,我们需要先从template_configs/Qwen_omni_template.toml
复制一份配置文件模板到configs/Qwen_omni.toml
。
toml
api_key = "your_api_key" # API密钥
base_url = "https://dashscope.aliyuncs.com/compatible-mode/v1" # API地址
model_name = "qwen-omni-turbo" # 模型名称
voice_character = "Chelsie" # 音色
media_format = "wav" # 音频格式,请使用wav格式
配置项详解
api_key
API密钥
这里填写的是 Qwen 服务的 API 密钥。大家需要前往阿里云的 DashScope控制台 创建并获取你的API Key。
百灵警告
API Key是你的重要凭证,请妥善保管,不要泄露给他人!
base_url
API地址
这个是千问服务的API接口地址。通常情况下不需要修改,保持默认的就好啦。
model_name
模型名称
这里指定的是使用的模型名称。你可以根据需要选择不同的模型。注意,请一定选用多模态且支持语音输出的模型哦!比如 qwen-omni-turbo
就是一个很好的选择。
voice_character
音色
这里可以配置你想要的音色。Qwen 提供了多种不同的音色选项,您可以根据自己的喜好进行选择。
media_format
音频格式
这里配置的是使用的音频格式。
现阶段,官方仅支持wav
格式,所以请大家根据官方文档进行修改哦~。