OmniVoice 是由下一代 Kaldi 社区(k2-fsa)开源的全多模态语音大模型框架,支持原生音频输入输出、低延迟流式推理及多语种实时语音对话。我要豆包
MOSS-TTS 是由 OpenMOSS 团队研发的旗舰级语音生成基础模型,支持高保真零样本语音克隆、超长音频稳定生成及精细化发音控制。grok ai官网