news studionews studio

MiniMax剑指GPT-4o,实时语音对话API产品11月发布

钛媒体AGI独家获悉,AI大模型领域的独角兽MiniMax将于今年11月发布对标GPT-4o的Realtime API服务,将提升端到端实时多模态处理能力,并带来更低延时、更自然、更沉浸的实时语音对话,为企业协作、社交、直播、游戏等多种场景提供服务。

这是MiniMax推出的首款端到端实时语音对话产品,将与OpenAI的GPT-4o正面交锋,为中国AI市场带来新的竞争格局。

MiniMax的野心

消息人士透露,MiniMax内部正在全力打磨这款产品,并希望在11月发布时产品效果直接对标OpenAI GPT-4o。这表明MiniMax对自身技术实力充满信心,并希望在实时语音对话领域与OpenAI一较高下。

GPT-4o是OpenAI今年5月推出的全新旗舰AI模型,可实时进行音频、视觉和文本推理,并以惊人的速度响应音频输入,与人类在对话中的反应速度一致。在API使用方面,GPT-4o的价格降低一半,速度提升两倍,使其成为开发者和企业的首选。

MiniMax选择在实时语音对话领域与GPT-4o竞争,无疑是看准了这一领域的巨大潜力。随着AI技术的快速发展,实时语音对话正在成为人机交互的重要方式,并在企业协作、社交、直播、游戏等领域展现出巨大的应用价值。

声网助力,打造中国版实时语音对话API

为了实现这一目标,MiniMax与实时语音技术公司声网合作,共同打造中国第一个Realtime API。声网创始人兼CEO赵斌在RTE 2024第十届实时互联网大会上表示,声网与MiniMax正在打磨这款API,基于该API的智能体产品,能够与人类进行轻松且流畅的实时语音交流。

声网在实时语音技术领域拥有丰富的经验和强大的技术实力,其提供的实时语音服务能够确保低延迟、高清晰度和稳定性,为MiniMax的实时语音对话API产品提供坚实的技术基础。

中国AI市场竞争激烈

除了MiniMax,目前包括科大讯飞、智谱AI、商汤科技等中国企业都在研发生成式AI对话产品,并与GPT-4o效果不相上下。OpenAI近期也开放了ChatGPT-4o对话功能,进一步推动了实时语音对话技术的应用。

根据艾瑞咨询的统计,2021年,对话式AI的市场规模为45亿元,带动规模126亿元。预计2026年,对话式 AI 市场规模将达108亿元,带动规模超385亿元,五年复合年均增长率(CAGR)达32.5%。

MiniMax的实时语音对话API产品将为中国AI市场带来新的竞争格局,并为企业和开发者提供更便捷、更智能的实时语音对话解决方案。

展望未来

MiniMax的实时语音对话API产品的发布,将进一步推动中国AI技术的发展,并为企业和开发者提供更便捷、更智能的实时语音对话解决方案。未来,随着AI技术的不断进步,实时语音对话将成为人机交互的重要方式,并在更多领域得到应用。

参考文献


>>> Read more <<<

Views: 8

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注