港大华为联手开源Dream-7B扩散模型

香港，[日期] – 香港大学与华为诺亚方舟实验室近日联合宣布开源其最新研发的扩散推理模型Dream-7B。这款模型在文本生成、数学问题求解和编程辅助等多个领域展现出卓越性能，被誉为目前最强大的开源扩散大语言模型之一，为AI社区带来了新的可能性。

Dream-7B的训练数据庞大，涵盖了文本、数学和代码等多种类型，预训练使用了高达5800亿个标记，耗时256小时。其核心优势在于采用了掩码扩散范式，通过双向上下文建模，显著提升了生成文本的全局连贯性。

与传统的自回归模型不同，Dream-7B基于离散扩散模型（Discrete Diffusion Models, DMs）架构，从完全噪声化的状态开始，逐步去噪生成文本。这种架构允许模型整合前向和后向信息，从而更好地理解上下文，生成更连贯、更符合逻辑的文本。

Dream-7B的技术亮点包括：

强大的文本生成能力： 在通用文本、数学和编程任务上，Dream-7B的表现优于同尺寸的自回归模型，甚至在某些情况下超越了最新的Deepseek V3 671B。
灵活的生成方式： Dream-7B支持任意顺序的文本生成，用户可以根据需求指定生成顺序，这为文本创作提供了更大的自由度。
高效的规划能力： 在需要多步规划的任务中，如Countdown和Sudoku等，Dream-7B表现出色，展现了其强大的推理能力。
可调节的生成质量： 用户可以调整扩散步数，平衡生成速度和质量，以满足不同应用场景的需求。

Dream-7B的应用前景广阔，可以应用于以下领域：

香港大学和华为诺亚方舟实验室选择开源Dream-7B，旨在促进AI技术的普及和发展。研究团队希望通过开源，吸引更多开发者和研究者参与到Dream-7B的改进和应用中来，共同推动AI技术的进步。

感兴趣的开发者和研究者可以通过以下链接获取更多信息：

Dream-7B的开源标志着扩散推理模型研究取得了新的进展。凭借其强大的性能、灵活的生成方式和广泛的应用场景，Dream-7B有望在AI领域发挥重要作用，为各行各业带来创新和变革。

参考文献：

HKUNLP. (2025). Dream-7B: A Powerful Open-Source Diffusion Language Model. Retrieved from https://hkunlp.github.io/blog/2025/dream/
GitHub. (n.d.). HKUNLP/Dream. Retrieved from https://github.com/HKUNLP/Dream
Hugging Face. (n.d.). Dream-org. Retrieved from https://huggingface.co/Dream-org
Hugging Face. (n.d.). multimodalart/Dream. Retrieved from https://huggingface.co/spaces/multimodalart/Dream