克隆声音。生成语音。构建语音驱动的应用。
所有这些都运行在你的机器上本地。
完全隐私——模特和语音数据会保存在你的机器上
专业工具——多轨时间线编辑器、音频修剪、对话混音
模型灵活性——目前由Qwen3-TTS驱动,近期将支持XTTS、Bark及其他型号
API优先——使用桌面应用或将语音合成集成到您自己的项目中
原生性能——用Tauri(Rust)构建,不是Electron
Mac 上超快——MLX 后端带原生 Metal 加速,Apple Silicon 推理速度快 4-5 倍
下载语音模型,从几秒钟的音频中克隆任意声音,并使用工作室级编辑工具创作多声部项目。不需要安装Python,不需要依赖云,也没有限制。
项目地址:https://github.com/jamiepine/voicebox



