文章来源:
腾赚网
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 wulanwray@foxmail.com 举报,一经查实,本站将立刻删除。
OpenAI近日发布三款全新语音模型,包括两款语音转文本模型GPT-4o Transcribe和GPT-4o MiniTranscribe,以及一款文本转语音模型GPT-4o MiniTTS。新模型在准确性、自然度等方面均有显著提升,尤其在多语言支持和复杂环境下的表现更为出色。相比之前的Whisper模型,新版本大幅降低了词错误率,同时减少了“幻觉”现象的发生,即不再随意编造词汇或内容。开发人员还强调,这些改进让模型更贴近实际应用场景,为用户提供更可靠的服务。
文本转语音模型GPT-4o MiniTTS则以高度可定制化为核心亮点。用户可通过简单指令调整语音风格,比如模拟疯狂科学家的语气或展现同理心的客服语调。这标志着OpenAI正逐步实现其“AI智能体”的愿景,即打造能独立完成任务的自动化系统。不过,与以往开源策略不同,此次发布的转录模型暂未公开,主要因其规模庞大且资源需求较高,难以在普通设备上运行。产品团队表示,未来开源将更加谨慎,确保模型真正满足特定需求。
抱歉,评论功能暂时关闭!