字节跳动发布豆包1.6，多模态深度思考

北京—— 在人工智能领域竞争日趋白热化的当下，字节跳动再次亮剑，正式推出其最新一代多模态深度思考大模型——豆包大模型1.6 (Doubao-Seed-1.6)。这款模型不仅在长文本处理能力上实现了突破，更在推理、数学、代码生成以及多模态理解等方面展现出卓越的性能，预示着字节跳动正加速布局AI生态，力图抢占AI生产力工具的制高点。

豆包大模型1.6的核心亮点在于其强大的多模态处理能力和深度思考模式。该模型支持auto、thinking和non-thinking三种思考模式，能够灵活应对不同复杂度的任务。它能够处理包括文字、图片、视频在内的多种输入形式，并输出高质量的文字内容。

256K超长上下文，解锁更多应用场景

豆包大模型1.6最大的亮点之一是其高达256K的超长上下文窗口。这意味着模型可以一次性处理更长的文本信息，从而更好地理解上下文语境，生成更连贯、更准确的内容。据官方数据，该模型最大输入长度可达224k tokens，输出长度支持最大16k tokens。

“长上下文能力是未来大模型发展的重要趋势，它能够让模型更好地理解用户的意图，并根据更全面的信息进行推理和决策，”一位不愿透露姓名的AI行业专家表示，“豆包1.6的256K上下文窗口，将使其在内容创作、智能对话、代码生成等领域拥有更广阔的应用前景。”

三大模型版本，满足不同需求

为了满足不同用户的需求，豆包大模型1.6推出了三个不同的模型版本：

doubao-seed-1.6： 全能综合型模型，具备深度思考、多模态理解及图形界面操作等多项能力，并支持自适应思考模式，可根据提示词的难度自动判断是否开启深度思考，从而在提升效果的同时，大幅减少tokens的消耗。
doubao-seed-1.6-thinking： 深度思考强化版，专注于深度思考，在代码编写、数学计算、逻辑推理等基础能力上进行了进一步提升，适合处理更复杂的任务。
doubao-seed-1.6-flash： 极速响应版本，具备深度思考和多模态理解能力，同时拥有极低的延迟，TOPT（Top-of-Pipeline Time）仅需 10ms，适合对响应速度要求极高的场景，例如实时交互和视觉任务处理。

性能卓越，权威测评表现亮眼

豆包大模型1.6在多个权威测评中表现优异，证明了其强大的实力。在GPQA Diamond测试中，豆包1.6-thinking模型取得了81.5分的成绩，达到全球第一梯队水平，成为目前最好的推理模型之一。在数学测评AIME25中，豆包1.6-thinking模型的成绩达到86.3分，相比豆包1.5深度思考模型提升12.3分。

应用广泛，赋能各行各业

凭借其强大的性能和多模态处理能力，豆包大模型1.6的应用场景十分广泛。它可以应用于内容创作，帮助用户快速生成高质量的文章、新闻稿、营销文案等；可以应用于智能对话，提供更自然、更流畅的对话体验；可以应用于代码生成，提高开发效率；还可以应用于图像识别、视频分析等领域。

目前，豆包1.6已在火山引擎上线，企业和开发者可以通过API调用体验其强大的功能。

统一定价模式，降低使用门槛

为了降低用户的使用门槛，豆包大模型1.6采用了统一的定价模式，无论是否开启深度思考模式，无论是文本还是视觉输入，tokens价格均一致。

输入长度0-32K：输入价格：0.8元/百万tokens；输出价格：8元/百万tokens。
输入长度32K-128K：输入价格：1.2元/百万tokens；输出价格：16元/百万tokens。
输入长度128K-256K：输入价格：2.4元/百万tokens；输出价格：24元/百万tokens。
输入32K、输出200 tokens以内：输入价格：0.8元/百万tokens；输出价格：2元/百万tokens。

结语

豆包大模型1.6的发布，标志着字节跳动在人工智能领域又迈出了坚实的一步。凭借其强大的多模态处理能力、深度思考模式和超长上下文窗口，豆包大模型1.6有望成为企业和开发者强大的AI生产力工具，赋能各行各业，推动人工智能技术的进一步发展。然而，在追求技术突破的同时，如何确保AI技术的安全、可靠和伦理，仍是整个行业需要共同思考和解决的问题。

参考文献：