北京 – 在人工智能领域,大型语言模型(LLM)正日益成为推动技术进步的关键力量。近日,中科闻歌正式推出其企业级大语言模型的旗舰版本——YAYI-Ultra(雅意)。这款混合专家模型不仅具备强大的多领域专业能力和多模态内容生成能力,更在缓解垂直领域迁移中的“跷跷板”现象上取得了显著进展,引发业界广泛关注。
YAYI-Ultra:打破垂直领域迁移瓶颈
传统的稠密模型在应用于特定垂直领域时,往往面临“跷跷板”效应,即在提升某一领域性能的同时,牺牲了其他领域的表现。YAYI-Ultra采用混合专家架构,通过集成数学、代码、金融、舆情、中医、安全等多个领域的专家模型,有效缓解了这一问题。这种架构允许模型根据任务需求,灵活调用不同领域的专家知识,从而在多个领域保持高性能和低能耗。
核心功能与技术亮点
YAYI-Ultra 的主要功能包括:
- 多领域专业能力: 混合专家模型架构,支持多种领域专家组合,显著缓解垂直领域迁移的“跷跷板”现象。
- 多模态内容生成: 支持图文并茂的输出,能根据用户的问题从知识库中提取相关信息,同步给出对应的图片内容。支持1000万+图文数据对齐。
- 超长文输出: 支持最长128k的输入和更长的上下文窗口,形成从“输入理解”到“内容创作”的全链路长文本能力闭环。
- 数据分析与可视化: 能准确完成数据分析、计算和图表绘制任务。
- 复杂任务智能规划: 增强了多工具串行调用场景下的规划合理性,能将复杂任务拆解为多个子任务,通过调用搜索引擎、代码解释器、图像解析等基础工具,以及新闻热榜追踪、传播影响力分析等垂直领域工具来完成任务。
- 联网智能创作: 支持联网收集信息完成创作,例如写一篇关于中国儒家文化发展历史的分析报告。
在技术原理上,YAYI-Ultra 基于大规模的高质量多语言语料进行训练,并结合指令微调技术,使其在不同领域和任务上表现出色。
评测表现与开源项目
在OpenCompass大模型公开学术榜单中,YAYI-Ultra 以64.5分的成绩首次闯入前十,成为TOP10中五个中国大模型之一。尤其在代码生成(LiveCodeBench排名第五)、复杂指令理解(IFEval排名第九)和知识推理能力(MMLU-Pro排名第九)等方面表现突出,甚至在代码生成方面超越了GPT-4o-20241120版本。
为了促进技术交流和应用,中科闻歌还开源了 YAYI-Ultra 的相关项目:
- Github仓库: https://github.com/wenge-research/YAYI2
- HuggingFace模型库: https://huggingface.co/wenge-research
应用场景广泛,赋能多行业
YAYI-Ultra 的强大能力使其在多个领域具有广泛的应用前景:
- 媒体领域: 帮助客户将内容创作时间缩短30%-50%,内容发布频率提升20%-40%,内容差错率从5%降至0.5%左右。
- 医疗领域: 基于YAYI的大医金匮中医大模型,可精准诊断500余种常见病症,辨证推理准确率高达90%,并面向C端用户推出了“大医金匮”中医健康管理APP。
- 财税领域: 基于YAYI的财税知识大模型,模型回答准确率90.1%,高于其他同类型模型,客户实现24小时不间断的咨询服务。
结语
YAYI-Ultra 的发布,不仅展示了中科闻歌在人工智能领域的强大实力,也为企业级大语言模型的发展注入了新的活力。其混合专家架构和多领域专业能力,有望打破传统模型的局限,为各行各业提供更精准、更高效的智能化解决方案。随着开源项目的推进和应用场景的不断拓展,YAYI-Ultra 有望成为推动人工智能技术进步的重要力量。
Views: 0
