XSpecMesh：競猜式解碼加速自回歸網格生成

研究背景與挑戰

自回歸模型在網格（Mesh）生成任務上因能維持拓撲精度，成為高品質 3D 重建的主流方案。然而，根據 arXiv:2507.23777v2，單次生成需成千上萬步預測，引發推理延遲與資源瓶頸，限制實時應用與生產流水線整合。

XSpecMesh 採用「多頭競猜式解碼」（Multi-Head Speculative Decoding）思路，整合輕量預測頭與原有骨幹網絡。預測頭在單次正向傳播中同時產出多個 token 候選，將多輪請求合併成一輪，顯著降低模型呼叫次數。

步驟一，輕量解碼頭並行生成 k 個網格 token 候選；步驟二，骨幹模型取回該批 token，分別進行真實分布驗證；步驟三，僅對不符品質閾值之候選執行重取。此流程將推理步數平均降低近 40%，符合高吞吐需求。

為免影響 Mesh 拓撲完整性，XSpecMesh 引入嚴格驗證策略：依據骨幹模型計算的機率分布，設定動態閾值（如 0.9 可信度），對低於閾值之 token 執行重取，確保生成品質不遞降。

輕量解碼頭透過「教師—學生式蒸餾」（Knowledge Distillation）向骨幹模型對齊機率分布。根據《ACL 2024》最新實驗，使用溫度調整後交叉熵損失，將 speculative 預測成功率從 72% 提升至 88%。

根據作者於 arXiv:2507.23777v2 發布之 Benchmark，XSpecMesh 在多種網格數據集（ShapeNet、ModelNet）下測得 1.7× 推理加速，Mesh 評估指標（Chamfer Distance、Normal Consistency）無顯著退化。

XSpecMesh 能無痛整合現有自回歸網格生成管線，適用於 AR/VR 即時渲染、雲端 3D 內容服務及製造業數位孿生。未來可延伸至多模態生成，並探索更高階預測頭結構與分布式蒸餾策略。

邀請鏈結：https://www.okx.com/join?channelId=42974376