Causal Negative Sampling via Diffusion Model 優化推薦系統泛化能力

新興負樣本採樣機制

在推薦系統中，負樣本採樣（negative sampling）是訓練階段的重要環節，能強化模型對正負例的判別能力。傳統以難度分層（easy/hard）為基礎的啟發式負樣本採樣方法（如基於流行度或模型置信度）已在多項研究中被證實能提升精準度與召回率。根據 arXiv:2508.07243v1 2025年研究指出，不同難度負樣本能引導模型學習更精確的決策邊界，但同時也可能潛藏偏差風險。

環境混淆因子挑戰

實際候選池往往受到曝光量、流行度等環境混淆因子（environmental confounders）影響。這些未觀測的外生因素可能導致模型誤判某些樣本為「困難負例」（false hard negatives，FHNS），進而學習到與真實偏好無關的虛假相關性。Petrov et al.（2024）透過理論與實證分析發現，FHNS 的引入會削弱模型在分布偏移場景下的泛化能力。

CNSDiff 方法概述

為解決候選池偏差與 FHNS 問題，本文介紹一種名為 Causal Negative Sampling via Diffusion（CNSDiff）的方法。CNSDiff 利用條件擴散模型在潛在空間中合成負樣本，避免直接采樣預設候選集合而帶來的偏差。此外，其在負樣本生成過程中加入因果正則化項（causal regularization），顯式消除曝光與流行度等混淆因子的影響。

條件擴散負樣本生成

CNSDiff 採用類似於 Denoising Diffusion Probabilistic Models（DDPM，Ho et al., 2021）架構，透過逐步向潛在表示中注入噪聲，再在用戶與項目條件下反向去噪，最終生成多樣且無候選池偏差的負樣本。該流程可分為：1. 將用戶-項目對映射至潛在向量；2. 設定時間步長與噪聲強度；3. 於條件訊息下反向抽樣；4. 還原為實際負樣本以供訓練。

因果正則化機制

為避免環境混淆因子「開後門路徑」，CNSDiff 引入基於背門調整（backdoor adjustment）的因果正則化項。該正則化項以混淆因子作為中介變數，對生成過程中因果圖結構進行約束，使最終負樣本在統計上與曝光或流行度無關。這種做法呼應 Pearl（2009）因果推論理論，確保模型訓練過程中專注於用戶真實偏好信號。

OOD 泛化實驗結果

在四種代表性分布偏移場景（時間切片偏移、用戶群體差異、項目庫更新、冷啟動測試）中，CNSDiff 與多個先進基線模型（如 DuoRec、SASRec）進行比較。實驗結果顯示，CNSDiff 在所有評估指標（HR@10、NDCG@10 等）上平均提升 13.96%，證實其在 OOD（out-of-distribution）推薦任務中的穩健性與有效性。

實務應用與未來展望

對於線上推薦平台，可將 CNSDiff 作為微服務部署於模型訓練流水線，在負樣本採樣步驟中替換傳統方法，無縫整合於 Kubernetes 容器化架構。未來研究可考慮結合多因子干預、分層擴散模型與增強學習技術，以進一步提升在更複雜商業場景中的泛化與效能。

邀請連結：https://www.okx.com/join?channelId=42974376