DOCTOR：跨域短影片錯假資訊偵測的模型與效能優化

短影片錯假資訊與跨域挑戰

短影片平台因為高黏著度與演算法推薦，已成為錯假資訊迅速散播的溫床。然而，現有的多模態錯假資訊偵測模型多半在特定訓練域（source domain）取得亮眼成績，卻難以有效面對新興平台或內容風格的差異（target domain）。根據 arXiv:2507.04061v2 中報告指出，域偏移（domain gap）會使模型的視覺或聲音特徵映射失準，導致偵測準確率明顯下降。針對此一問題，DOCTOR（DOmain generalization via ConsisTency and invariance learning for shORt-video misinformation detection）提出了兩大深度洞見：一是各域可能偏重單一模態（視訊或音訊）；二是跨模態融合時，單一模態中的偏差會被放大，進而損害最終偵測效能。

在多模態應用中，實務工程師往往需要在效能與資源消耗間取得平衡；因此，針對跨域挑戰設計的模型，不僅要兼顧演算法泛化能力，更要關注後端運算資源與前端推理延遲。