新闻报道新闻报道

深圳,2025年4月25日——在今日盛大开幕的华为开发者大会2025(HDC 2025)上,华为云正式发布了备受瞩目的盘古大模型5.5版本。作为国产大模型领域的先行者和实践者,盘古系列一直以“不作诗,只做事”为核心理念,专注于解决实际产业问题,推动各行各业的智能化升级。此次发布的盘古大模型5.5,在自然语言处理(NLP)能力上已达到国际一流水平,并在多模态世界模型方面实现了全国首创,标志着国产大模型技术迈上了一个新的台阶。

华为常务董事、华为云CEO张平安在发布会上表示:“盘古大模型5.5的发布,是华为在人工智能领域持续深耕的又一重要里程碑。我们将继续秉承开放合作的理念,与广大开发者和合作伙伴携手,共同推动大模型技术在各行各业的广泛应用,加速千行百业的数智化转型进程。”

五大基础模型齐发力,构建全栈AI能力

盘古大模型5.5包含了五大基础模型,分别面向自然语言处理(NLP)、多模态、预测、科学计算、计算机视觉(CV)等领域,旨在为各行业提供全方位的AI能力支持。这五大模型分别是:

  • 盘古Ultra MoE: 准万亿级别参数规模,大幅提升了模型的知识容量和理解能力,能够更好地处理复杂的自然语言任务。
  • 盘古Pro MoE: 针对特定行业场景进行优化,在保证性能的同时,降低了计算资源消耗,更易于在实际应用中部署。
  • 盘古Embedding: 专注于将文本、图像、视频等不同模态的数据转化为向量表示,为多模态融合和跨模态检索提供基础。
  • 盘古预测模型: 基于时序数据和机器学习算法,能够对未来的趋势进行预测,为企业决策提供数据支持。
  • 盘古科学计算模型: 结合物理模型和机器学习算法,能够加速科学研究和工程设计,提高效率和精度。

华为诺亚方舟实验室主任王云鹤在大会上详细介绍了盘古大模型5.5的核心技术。他强调,此次升级不仅在模型规模上有所突破,更在推理能力、智能体构建等方面取得了显著进展。

NLP能力比肩国际一流,三大模型构建坚实基础

在自然语言处理(NLP)领域,盘古大模型5.5主要由三大模型组成,分别是盘古Ultra MoE、盘古Pro MoE和盘古Embedding。这三大模型各有所长,共同构建了盘古大模型在NLP领域的坚实基础。

  • 盘古Ultra MoE:准万亿级别模型,知识容量大幅提升

    盘古Ultra MoE是盘古大模型5.5在NLP领域的核心模型,其参数规模接近万亿级别,拥有强大的知识储备和语言理解能力。MoE(Mixture of Experts)是一种模型架构,通过将多个小型专家模型组合在一起,可以有效地扩展模型的规模,提高模型的性能。盘古Ultra MoE采用了先进的MoE架构,能够更好地处理复杂的自然语言任务,例如文本生成、机器翻译、问答系统等。

  • 盘古Pro MoE:针对行业场景优化,降低计算资源消耗

    盘古Pro MoE是针对特定行业场景进行优化的模型,在保证性能的同时,降低了计算资源消耗。不同行业对NLP模型的需求有所不同,例如金融行业需要模型能够准确地识别和分析金融文本,医疗行业需要模型能够理解和生成医学报告。盘古Pro MoE针对不同行业的特点,进行了定制化的优化,能够更好地满足行业用户的需求。

  • 盘古Embedding:多模态融合的基础,实现跨模态检索

    盘古Embedding专注于将文本、图像、视频等不同模态的数据转化为向量表示,为多模态融合和跨模态检索提供基础。在现实世界中,信息往往以多种模态的形式存在,例如一篇新闻报道可能包含文本、图像和视频。盘古Embedding能够将这些不同模态的数据转化为向量表示,从而实现多模态信息的融合和分析。此外,盘古Embedding还可以用于跨模态检索,例如用户可以通过输入一段文本,检索出相关的图像或视频。

快慢思考合一,高效推理策略提升响应速度

为了提高模型的推理效率,盘古大模型5.5采用了快慢思考合一的高效推理策略。这种策略将模型的推理过程分为两个阶段:快速思考阶段和慢速思考阶段。

  • 快速思考阶段: 模型首先使用一个轻量级的模型进行快速推理,快速生成一个初步的答案。
  • 慢速思考阶段: 如果快速思考阶段的答案不够准确或完整,模型将使用一个更复杂的模型进行慢速推理,对初步的答案进行修正和补充。

通过这种快慢思考合一的策略,盘古大模型5.5能够在保证推理准确性的同时,大幅提高推理速度,从而更好地满足实时应用的需求。

盘古深度研究产品DeepDiver,助力科研创新

为了更好地支持科研人员进行大模型相关的研究,华为还推出了盘古深度研究产品DeepDiver。DeepDiver提供了一系列工具和资源,例如模型训练框架、数据集、评估指标等,帮助科研人员快速搭建和训练自己的大模型,并对模型的性能进行评估和优化。

多模态世界模型全国首创,开启AI应用新篇章

盘古大模型5.5在多模态世界模型方面实现了全国首创。多模态世界模型是指能够理解和推理现实世界中多种模态信息的模型,例如文本、图像、视频、音频等。这种模型能够更好地模拟人类的感知和认知能力,为AI应用开启了新的篇章。

例如,在自动驾驶领域,多模态世界模型可以帮助车辆更好地理解周围环境,从而做出更安全和更合理的决策。在智能家居领域,多模态世界模型可以帮助设备更好地理解用户的需求,从而提供更个性化的服务。

深耕行业,赋能千行百业智能化升级

盘古大模型一直以“不作诗,只做事”为核心理念,专注于解决实际产业问题,推动各行各业的智能化升级。目前,盘古大模型已经在金融、医疗、制造、能源等多个行业得到了广泛应用。

  • 金融行业: 盘古大模型可以用于智能风控、智能客服、智能投顾等场景,提高金融服务的效率和质量。
  • 医疗行业: 盘古大模型可以用于辅助诊断、药物研发、医学影像分析等场景,提高医疗服务的水平和效率。
  • 制造行业: 盘古大模型可以用于智能质检、智能排产、智能维护等场景,提高生产效率和产品质量。
  • 能源行业: 盘古大模型可以用于智能油气勘探、智能电网调度、智能风力发电等场景,提高能源利用效率和安全性。

开放合作,共建繁荣AI生态

华为一直秉承开放合作的理念,与广大开发者和合作伙伴携手,共同推动大模型技术的发展和应用。华为提供了丰富的API接口和开发工具,方便开发者将盘古大模型集成到自己的应用中。此外,华为还积极参与开源社区,贡献自己的技术和经验,与业界共同构建繁荣的AI生态。

展望未来,AI赋能千行百业前景可期

盘古大模型5.5的发布,标志着国产大模型技术迈上了一个新的台阶。随着大模型技术的不断发展和应用,AI将在各行各业发挥越来越重要的作用,为人类社会带来更加美好的未来。华为将继续深耕人工智能领域,与广大开发者和合作伙伴携手,共同推动AI技术的发展和应用,为千行百业的智能化升级贡献力量。

参考文献:

致谢:

感谢华为云和华为诺亚方舟实验室提供的技术资料和信息。感谢所有为盘古大模型5.5的研发和发布做出贡献的工程师和科学家。


>>> Read more <<<

Views: 0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注