MiniMax剑指GPT-4o,实时语音对话API产品11月发布
钛媒体AGI独家获悉,AI大模型领域的独角兽MiniMax将于今年11月发布对标GPT-4o的Realtime API服务,将提升端到端实时多模态处理能力,并带来更低延时、更自然、更沉浸的实时语音对话,为企业协作、社交、直播、游戏等多种场景提供服务。
这是MiniMax推出的首款端到端实时语音对话产品,将与OpenAI的GPT-4o正面交锋,为中国AI市场带来新的竞争格局。
MiniMax的野心
消息人士透露,MiniMax内部正在全力打磨这款产品,并希望在11月发布时产品效果直接对标OpenAI GPT-4o。这表明MiniMax对自身技术实力充满信心,并希望在实时语音对话领域与OpenAI一较高下。
GPT-4o是OpenAI今年5月推出的全新旗舰AI模型,可实时进行音频、视觉和文本推理,并以惊人的速度响应音频输入,与人类在对话中的反应速度一致。在API使用方面,GPT-4o的价格降低一半,速度提升两倍,使其成为开发者和企业的首选。
MiniMax选择在实时语音对话领域与GPT-4o竞争,无疑是看准了这一领域的巨大潜力。随着AI技术的快速发展,实时语音对话正在成为人机交互的重要方式,并在企业协作、社交、直播、游戏等领域展现出巨大的应用价值。
声网助力,打造中国版实时语音对话API
为了实现这一目标,MiniMax与实时语音技术公司声网合作,共同打造中国第一个Realtime API。声网创始人兼CEO赵斌在RTE 2024第十届实时互联网大会上表示,声网与MiniMax正在打磨这款API,基于该API的智能体产品,能够与人类进行轻松且流畅的实时语音交流。
声网在实时语音技术领域拥有丰富的经验和强大的技术实力,其提供的实时语音服务能够确保低延迟、高清晰度和稳定性,为MiniMax的实时语音对话API产品提供坚实的技术基础。
中国AI市场竞争激烈
除了MiniMax,目前包括科大讯飞、智谱AI、商汤科技等中国企业都在研发生成式AI对话产品,并与GPT-4o效果不相上下。OpenAI近期也开放了ChatGPT-4o对话功能,进一步推动了实时语音对话技术的应用。
根据艾瑞咨询的统计,2021年,对话式AI的市场规模为45亿元,带动规模126亿元。预计2026年,对话式 AI 市场规模将达108亿元,带动规模超385亿元,五年复合年均增长率(CAGR)达32.5%。
MiniMax的实时语音对话API产品将为中国AI市场带来新的竞争格局,并为企业和开发者提供更便捷、更智能的实时语音对话解决方案。
展望未来
MiniMax的实时语音对话API产品的发布,将进一步推动中国AI技术的发展,并为企业和开发者提供更便捷、更智能的实时语音对话解决方案。未来,随着AI技术的不断进步,实时语音对话将成为人机交互的重要方式,并在更多领域得到应用。
参考文献
- 钛媒体AGI独家|大模型独角兽MiniMax将于11月发布首款对标GPT-4o的端到端实时语音对话API产品 https://www.tmtpost.com/564479.html
- OpenAI 发布实时 API 公开测试版 https://openai.com/blog/introducing-realtime-api
- 声网与MiniMax合作打造中国第一个Realtime API https://www.agora.io/cn/blog/realtime-api-mini-max/
- 艾瑞咨询:对话式AI市场规模将达108亿元 https://www.iresearch.com.cn/
Views: 8
