复旦字节联手，BlockDance加速扩散模型！

上海—— 近日，复旦大学与字节跳动智能创作团队联合发布了一项名为BlockDance的创新技术，旨在显著加速扩散模型的推理过程。该方法通过识别并重用相邻时间步中结构相似的时空特征（STSS），有效减少了冗余计算，从而大幅提升了推理速度，最高可达50%。

扩散模型作为近年来人工智能领域的热点，在图像生成、视频生成等任务中表现出色。然而，其计算密集型的特性也限制了其在实际应用中的普及。BlockDance的出现，无疑为解决这一难题提供了新的思路。

BlockDance的核心技术原理

BlockDance的核心在于其对扩散模型去噪过程的深入理解。研究人员发现，在去噪的后期阶段，相邻时间步的特征之间存在高度的相似性，尤其是在负责生成图像结构信息的浅层和中层模块中。基于此，BlockDance通过以下关键步骤实现加速：

特征相似性分析： 通过算法识别并提取结构相似的时空特征（STSS）。
缓存与重用机制： 将去噪过程划分为“缓存步骤”和“重用步骤”。在缓存步骤中，模型保存特定模块的特征输出；在重用步骤中，模型直接使用缓存的特征，跳过重复计算。
动态决策网络（BlockDance-Ada）： 引入基于强化学习的轻量级决策网络，根据生成任务的复杂性动态调整计算资源的分配，实现速度与质量的平衡。

BlockDance-Ada通过强化学习优化，能够根据不同的生成任务，动态决定哪些步骤应该进行缓存，哪些步骤可以进行重用。这种动态调整机制使得BlockDance在保证生成质量的同时，实现了最大的加速效果。

BlockDance的应用前景

BlockDance的优势在于其广泛的适用性。它可以无缝应用于多种扩散模型和生成任务，包括：

专家观点

一位匿名的人工智能专家表示：“BlockDance的创新之处在于其对扩散模型内部机制的深刻理解，以及对计算资源的精细化管理。这种基于特征重用的加速方法，不仅能够显著提升推理速度，而且能够保持生成质量，具有很高的应用价值。”

未来展望

BlockDance的发布，标志着扩散模型加速技术迈出了重要一步。随着研究的深入和技术的不断完善，BlockDance有望在更多领域得到应用，为人工智能的发展注入新的活力。

项目地址与技术论文

关键词： 扩散模型，加速，人工智能，复旦大学，字节跳动，BlockDance，图像生成，视频生成，强化学习。