云从科技发布“从容”大模型，多模态AI再添新军

引言：

人工智能领域风起云涌，多模态AI模型正成为推动行业变革的关键力量。近日，中国人工智能企业云从科技重磅推出的“从容大模型”在国际权威评测平台OpenCompass的多模态榜单上以80.7分的优异成绩荣登榜首，超越了谷歌、OpenAI等国际顶尖科技巨头，引发业界广泛关注。这一突破性进展不仅彰显了中国AI技术的崛起，也预示着多模态AI在各行各业的智能化应用将迎来新的发展机遇。

正文：

多模态AI：人工智能发展的新引擎

人工智能的发展历程可以大致划分为几个阶段，从最初的专家系统到机器学习，再到深度学习，每一次技术突破都极大地拓展了AI的应用边界。近年来，随着数据量的爆炸式增长和计算能力的不断提升，多模态AI逐渐崭露头角，成为人工智能领域的新引擎。

所谓多模态AI，是指能够同时处理和理解多种不同类型数据的AI模型，例如图像、文本、音频、视频等。传统的AI模型往往只能处理单一类型的数据，例如图像识别模型只能处理图像，自然语言处理模型只能处理文本。而多模态AI模型则能够将不同类型的数据融合在一起，从而获得更全面、更深入的理解。

多模态AI的优势在于其能够模拟人类的认知方式。人类在感知世界时，往往会同时利用多种感官，例如视觉、听觉、触觉等。多模态AI模型通过模拟人类的感知方式，能够更好地理解复杂的世界，从而实现更智能化的应用。

云从科技“从容大模型”：技术突破与创新

云从科技推出的“从容大模型”正是多模态AI领域的杰出代表。该模型聚焦通用视觉语言理解与推理任务，通过多模态对齐、决策类人化、高效工程优化和原生多模态推理等核心技术突破，构建了全球领先的技术壁垒。

1. 多模态对齐：提升模型理解和推理能力

多模态对齐是多模态AI模型的核心技术之一，其目标是将不同模态的数据映射到同一个语义空间中，从而使模型能够更好地理解和推理不同模态数据之间的关系。

云从科技在多模态对齐方面进行了深入研究，构建了高质量的基准数据集，涵盖多种任务场景。同时，云从科技还基于强化指令对齐技术，提升模型对多模态数据的理解和推理能力。此外，云从科技还融合了DPO和GRPO技术，优化模型的学习机制，使模型更贴近人类思维进行决策推理，无需依赖奖励模型实现类人化推理决策。

2. 决策类人化：模拟人类思维进行决策

决策类人化是指使AI模型能够像人类一样进行决策。传统的AI模型往往基于预设的规则或算法进行决策，缺乏灵活性和适应性。而决策类人化的AI模型则能够通过学习人类的决策过程，从而更好地应对复杂和不确定的环境。

云从科技在决策类人化方面进行了创新性探索，通过融合DPO和GRPO技术，优化模型的学习机制，使模型更贴近人类思维进行决策推理。这种方法无需依赖奖励模型，即可实现类人化推理决策，大大提高了模型的效率和鲁棒性。

3. 高效工程优化：提升模型处理高分辨率图像和复杂文档的能力

在实际应用中，多模态AI模型往往需要处理高分辨率图像和复杂文档。然而，处理这些数据需要消耗大量的计算资源和时间。因此，高效工程优化是多模态AI模型的重要组成部分。

云从科技针对高分辨率图像和多模态文档理解任务，对模型的图像编码器进行结构优化，高效处理高分辨率图像和复杂文档。同时，云从科技还优化了模型的上下文建模能力，精准追踪长文本中的逻辑关系，支持跨页文档分析和多轮对话等任务。

4. 原生多模态推理：实现复杂的多模态任务

原生多模态推理是指模型能够直接处理多图、跨图场景的图文交错模式和原生视频模式。传统的AI模型往往需要将多模态数据转换为单一模态数据才能进行处理，这会损失大量的信息。而原生多模态推理则能够直接处理多模态数据，从而实现更复杂的多模态任务。

云从科技升级了模型架构，使其能够处理多图、跨图场景的图文交错模式和原生视频模式。这使得“从容大模型”能够实现跨图比较、图文组合推理、多图问答等复杂的多模态任务。

“从容大模型”的应用场景：赋能千行百业智能化转型

“从容大模型”凭借其强大的技术能力，在金融、制造、政务等多个领域实现规模化落地，助力智能化转型。

1. 金融风控：构建风控AI智能体

金融风控是金融行业的核心业务之一。传统的金融风控往往依赖人工审核，效率低下且容易出错。而“从容大模型”则能够与银行合作，构建风控AI智能体，实现风险识别自动化，降低投诉量。

风控AI智能体能够自动分析客户的信用记录、交易行为、社交网络等数据，从而识别潜在的风险。此外，风控AI智能体还能够自动审核贷款申请、信用卡申请等业务，大大提高了审核效率和准确性。

2. 智能客服：提升问答准确率和客服效率

智能客服是电商平台的重要组成部分。传统的智能客服往往基于预设的规则或知识库进行问答，缺乏灵活性和适应性。而“从容大模型”则能够为电商平台部署智能客服平台，提升问答准确率和客服效率。

智能客服平台能够自动回答客户的问题，解决客户的疑虑。此外，智能客服平台还能够根据客户的问题进行个性化推荐，提高客户的满意度。

3. 医学健康：辅助医生诊断，提升诊断准确性和效率

医学健康是多模态AI的重要应用领域之一。“从容大模型”能够处理医学影像，辅助医生诊断，提升诊断准确性和效率。

“从容大模型”能够自动分析医学影像，例如X光片、CT片、MRI片等，从而识别潜在的病灶。此外，“从容大模型”还能够根据患者的病史、症状等信息，进行综合分析，提供更准确的诊断结果。

4. 政务领域：处理政务文档，实现智能审查和问答

政务领域是多模态AI的另一个重要应用领域。“从容大模型”能够处理政务文档，实现智能审查和问答，优化公共服务。

“从容大模型”能够自动审查政务文档，例如合同、发票、表格等，从而识别潜在的风险。此外，“从容大模型”还能够自动回答公众的问题，提供更便捷的公共服务。

5. 制造业：用在产品质量检测，提升生产效率和产品质量

制造业是多模态AI的重要应用领域之一。“从容大模型”能够用在产品质量检测，提升生产效率和产品质量。

“从容大模型”能够自动检测产品表面的缺陷，例如划痕、污渍、裂纹等，从而提高产品质量。此外，“从容大模型”还能够根据产品的图像进行分类，从而提高生产效率。

行业影响与未来展望

云从科技“从容大模型”的成功登顶，不仅是中国AI技术的重大突破，也对整个行业产生了深远的影响。

1. 推动多模态AI技术的发展

“从容大模型”的技术突破，为多模态AI技术的发展提供了新的思路和方法。相信在“从容大模型”的带动下，将会有更多的企业和研究机构投入到多模态AI的研究中，从而推动多模态AI技术的快速发展。

2. 加速各行各业的智能化转型

“从容大模型”在金融、制造、政务等多个领域的成功应用，证明了多模态AI在赋能千行百业智能化转型方面的巨大潜力。相信在“从容大模型”的推动下，将会有更多的企业采用多模态AI技术，从而加速各行各业的智能化转型。

3. 提升中国AI技术的国际竞争力

“从容大模型”在国际权威评测平台OpenCompass的多模态榜单上登顶，超越了谷歌、OpenAI等国际顶尖科技巨头，彰显了中国AI技术的崛起。相信在“从容大模型”的带动下，中国AI技术将会在国际舞台上发挥越来越重要的作用。

展望未来，多模态AI技术将会在更多领域得到应用，例如自动驾驶、智能家居、虚拟现实等。同时，多模态AI技术也将会面临更多的挑战，例如数据隐私、算法安全、伦理道德等。相信在政府、企业、研究机构的共同努力下，多模态AI技术将会克服这些挑战，为人类社会带来更大的福祉。

结论：

云从科技“从容大模型”的成功，是中国人工智能领域的一项重要里程碑。它不仅展示了中国企业在AI技术上的创新能力，也预示着多模态AI将在推动各行各业智能化转型中发挥关键作用。随着技术的不断进步和应用场景的不断拓展，我们有理由相信，多模态AI将为人类社会带来更加美好的未来。

参考文献：

OpenCompass多模态榜单
云从科技官方网站
相关学术论文和专业报告

致谢：

感谢云从科技为本文提供的相关信息和支持。

>>> Read more <<<

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

云从科技发布“从容”大模型，多模态AI再添新军

作者智能小编

多模态AI：人工智能发展的新引擎