DOCTOR:跨域短影片錯假資訊偵測的模型與效能優化

短影片錯假資訊與跨域挑戰

短影片平台因為高黏著度與演算法推薦,已成為錯假資訊迅速散播的溫床。然而,現有的多模態錯假資訊偵測模型多半在特定訓練域(source domain)取得亮眼成績,卻難以有效面對新興平台或內容風格的差異(target domain)。根據 arXiv:2507.04061v2 中報告指出,域偏移(domain gap)會使模型的視覺或聲音特徵映射失準,導致偵測準確率明顯下降。針對此一問題,DOCTOR(DOmain generalization via ConsisTency and invariance learning for shORt-video misinformation detection)提出了兩大深度洞見:一是各域可能偏重單一模態(視訊或音訊);二是跨模態融合時,單一模態中的偏差會被放大,進而損害最終偵測效能。

在多模態應用中,實務工程師往往需要在效能與資源消耗間取得平衡;因此,針對跨域挑戰設計的模型,不僅要兼顧演算法泛化能力,更要關注後端運算資源與前端推理延遲。