Posted inNEWS
重探影響函數在資料歸因中的應用
Influence Functions 理論基礎 資料歸因 (Data Attribution) 旨在追溯模型預測至訓練樣本,以辨識哪些資料最具影響力,並理解模型行為為何會導致特定預測結果。影響函數 (Influence Functions) 源自穩健統計 (Robust Statistics),最早由 Cook 和 Weisberg(1980)提出,用於分析模型參數對資料點加權或移除的敏感度,進而預估預測變化。近年,Koh 和 Liang (2017) 在《ICML》上發表將影響函數擴展至深度學習的研究,提出一階近似法,無需昂貴的重訓練即可評估單筆樣本貢獻。本段引述 arXiv:2508.07297v1(2025)最新回顧,並結合《Journal of Machine Learning Research》與 Google AI Blog 的論述,奠定全篇理論基石。 逆海森估計的效能優化 計算影響函數的關鍵在於逆海森矩陣與向量積…









