新興個人化標題生成的挑戰與機會 隨著新聞推薦與內容分發平台日益普及,精準生成符合用戶興趣的標題(Personalized Headline Generation)成為關鍵技術之一。然而,大多數現有方法僅依賴整體歷史點擊行為,忽略了隱式反饋中所夾雜的「非真實興趣」噪聲(Fake Interests),如短停留時間或短時段點擊洪峰。根據arXiv:2508.07178v1(2025)研究指出,這些隱性噪聲會導致模型產出與用戶真實偏好嚴重偏離的「幻覺標題」(hallucinated headlines),最終影響用戶點擊率(CTR)與整體體驗。 雙階段噪聲去除策略設計 為應對點擊噪聲問題,PHG-DIF框架(Personalized Headline Generation via Denoising Implicit Feedback)採用「雙階段過濾」(dual-stage filtering)機制。第一階段以停留時間(dwell time)門檻篩選短暫瀏覽行為;第二階段則透過異常點擊群聚檢測(abnormal click bursts),刪除在極短時間內對同類型內容的大量點擊。此策略靈感來自於Alibaba DIN(Deep Interest Network)中對用戶行為選擇性加權之思路(Zhou et al., SIGIR 2018)。經實驗發現,雙階段去噪可降低20%的噪聲干擾,並為後續建模提供更乾淨的興趣序列。 多層次時間融合動態建模 清洗後的興趣序列需兼顧長短期偏好。PHG-DIF採用「多層次時間融合」(multi-level temporal fusion)機制,分別對短期行為(過去一天)、中期行為(過去一週)與長期行為(過去一個月)進行編碼,並使用注意力機制(Attention)整合動態權重。此方法參考Transformer結構,並結合RNN/GRU以捕捉微小時間變化。實作中可參考PHG-DIF 實作,便於部署於現有微服務架構中。…
Posted by
Ray 阿瑞