Wave-PDE Nets:以可訓練波動方程層取代 Attention 的高效架構 本文由資深全端工程師從架構設計、效能 Benchmark 與實務應用角度,深入剖析 Wave-PDE Nets。探討其 symplectic spectral solver、物理歸納偏差及實測 30% 加速、25% 記憶體優化成效,並提供白皮書與原始碼參考連結。 Posted by Ray 阿瑞 19 1 月, 2026
Fused Kernel Library:C++17自動融合GPU函式提速實戰 為何需 Kernel Fusion在傳統GPGPU程式設計中… Posted by Ray 阿瑞 27 11 月, 2025