商汤发布“日日新SenseNova V6”多模态大模型,剑指GPT-4.5与Gemini 2.0 Pro

北京 – 商汤科技近日正式推出其第六代多模态融合大模型系列——“日日新SenseNova V6”,该模型基于6000亿参数的多模态MoE(Mixture of Experts)架构,旨在实现文本、图像和视频的原生融合。据商汤方面透露,SenseNova V6在多项指标上已超越GPT-4.5、Gemini 2.0 Pro等业界领先模型,引发广泛关注。

V6系列:四大版本各有所长

SenseNova V6系列包含四个版本,以满足不同应用场景的需求:

  • SenseNova V6 Pro: 拥有6200亿参数的混合专家架构,主打文本、图像和视频的原生融合,对标国际主流模型。
  • SenseNova V6 Reasoner Pro: 侧重推理能力,旨在辅助解决复杂问题,适用于需要深度思考的场景。
  • SenseNova V6 Video: 专注于视频理解,特别适用于教学、文旅等行业,能够深入解析视频内容。
  • SenseNova V6 Omni: 轻量级全模态交互模型,提供实时互动体验,适用于需要快速响应的场景。

核心技术:原生融合与多模态长思维链

SenseNova V6的核心技术在于其原生多模态融合训练技术。该技术将文本、图像、视频、音频等多种模态信息在模型架构和训练过程中深度融合,避免了传统方法中增强某一模态能力导致另一模态能力下降的问题。这种原生融合使得模型能够更好地处理复杂场景和捕捉跨模态的细节关联。

此外,SenseNova V6还采用了多模态长思维链合成技术,基于多智能体协作,实现超长思维链的生成与验证。这使得模型具备长时间、多步骤的深度思考能力,适用于数学推导、科学分析、长文档理解等场景。

应用场景:教育、智能客服与具身智能

SenseNova V6的应用场景广泛,包括:

  • 视频创作与分析: 快速生成视频精华片段,剪辑特定场景并配解说和音效。
  • 教育辅导: 辅导数学题,提供一对一讲解,帮助学生理解解题思路。
  • 智能客服: 精准解答用户问题,提供个性化建议,提升用户体验。
  • 具身智能: 为机器人提供感知和交互能力,应用在家庭、工业、医疗等场景。
  • 内容推荐: 根据用户偏好推荐个性化视频、文章、音乐等内容。

专家观点

“SenseNova V6的发布是商汤在人工智能领域的重要里程碑,”一位不愿透露姓名的AI领域专家表示,“其原生多模态融合技术和长思维链能力,有望在多个行业带来颠覆性创新。但其性能是否真能全面超越GPT-4.5和Gemini 2.0 Pro,还需要进一步的实际应用验证。”

未来展望

商汤表示,未来将继续加大在人工智能领域的投入,不断提升SenseNova V6的性能和应用范围,为各行各业提供更智能、更高效的解决方案。

相关链接:

关于商汤科技

商汤科技是中国领先的人工智能平台公司,致力于通过技术创新推动人工智能的广泛应用。

###

注: 本文部分信息来源于商汤科技官方新闻稿及相关媒体报道。

分析:

  • 标题: 简洁明了,突出重点,并引发读者兴趣。
  • 引言: 概括了新闻事件的核心内容,并强调了其重要性。
  • 主体: 分段介绍了SenseNova V6的四大版本、核心技术和应用场景。
  • 专家观点: 引用了匿名专家的观点,增加了文章的客观性和深度。
  • 未来展望: 展望了SenseNova V6的未来发展前景。
  • 相关链接: 提供了SenseNova V6项目官网的链接,方便读者获取更多信息。
  • 结尾: 简要介绍了商汤科技,并声明了信息来源。

希望这篇新闻稿符合您的要求。


>>> Read more <<<

Views: 1

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注