Posted inNEWS
Macro-from-Micro 規劃:自回歸長影片高品質並行生成框架
技術背景與挑戰 隨著自回歸擴散模型(autoregressive diffusion model)在影像生成領域的成熟,短時長影片的品質已達到業界領先水準,但在長時序影片合成時,卻面臨時間漂移(temporal drift)與誤差累積(error accumulation)問題。根據 arXiv:2508.03334v2 研究指出,傳統自回歸方式雖能延展序列長度,卻無法有效抑制關鍵幀產生的連鎖誤差,最終導致影片整體一致性下降,並且難以同時利用多張 GPU 加速生成。 Macro-from-Micro 規劃架構概述 為了解決上述難題,《Macro-from-Micro Planning》(以下簡稱 MMPL)採用「先規劃後填充」的雙層分段流水線。首先透過 Micro Planning,在每個短段影片內預測稀疏關鍵幀,提供動態(motion)與外觀(appearance)先驗;接著以 Macro Planning 建立整段影片的自回歸關鍵幀鏈(autoregressive chain),確保段與段之間的長期一致。最後,Content Populating 模組並行生成所有中間幀,配合 Adaptive Workload Scheduling 實現多 GPU 平衡運算,成功打破「一幀一生成」的序列瓶頸。 Micro…