利用生成式 AI 強化 O-RAN 異常檢測：對抗 Hypoglyph 資料操縱攻擊

O-RAN 架構與安全挑戰

Open Radio Access Network（O-RAN）結合 5G 網路與開放化模組（xApp、rApp），透過半標準化共用資料層（SDL）實現智慧化部署。然而，這種開放架構也帶來新的安全風險：惡意 xApp 可經由 SDL 注入細微的 Unicode 層級惡意字元（稱為 hypoglyphs），操縱關鍵指標數據。根據 arXiv:2508.08029v1，這類攻擊會導致傳統機器學習模型（例如 AutoEncoder）異常偵測失效。

Hypoglyph 攻擊機制解析

Hypoglyph 是將視覺相似的 Unicode 字元替換原始資料中常用標籤，如將『A』替換成希臘字母『Α』（U+0391）。此類微小改動在人眼難以察覺，卻能讓傳統 ML 特徵提取器拋出格式錯誤或跳過檢測，造成偵測系統崩潰。根據《IEEE Transactions on Information Forensics and Security》2024 年研究，超過 85％的基於字元層特徵的模型容易受此攻擊影響。

傳統 ML 檢測限制

AutoEncoder、Isolation Forest 等異常偵測方法，依賴固定特徵或向量化流程，面對非預期字元時往往崩潰或被跳過特徵工程步驟。這些模型在 Near-RT RIC（近實時無線介面控制器）部署中，偵測延遲可能高達 0.2 秒（根據 3GPP TS 38.413 規範），無法兼顧準確度與實時性。

LLM 應用於異常檢測

近年研究顯示，大型語言模型（LLM）具備更強的文本容錯能力，能解析並正規化含 hypoglyphs 的輸入文字。根據 arXiv:2508.08029v1，LLM 基於 Transformer 架構，可在 prompt engineering 下自動對輸入做 Unicode 正規化，避免崩潰並維持語意辨識。此外，LLM 可藉由零樣本（zero-shot）或少樣本（few-shot）提示，適應新的攻擊方式，具備更高韌性。

性能與延遲評估

實測結果顯示，LLM xApp 在 Near-RT RIC 環境下偵測延遲低於 0.07 秒，滿足 3GPP 定義的 0.1 秒閾值。雖然初期準確率約 78％，仍待以提示工程與微調提升至 90％以上，但其韌性明顯優於傳統 ML。根據 NVIDIA Triton Inference Server Benchmark，部署優化過的 LLama2 模型能支援高併發推論，兼顧效能與延遲。

持續改進與未來展望

LLM 在 O-RAN 異常偵測的初步成效，顯示生成式 AI 能有效抵禦資料操縱攻擊。未來可結合多模型融合（ensemble）或知識蒸餾（knowledge distillation），進一步降低資源耗用並提升準確度。此外，透過動態 prompt 更新，可快速回應新型 hypoglyph 攻擊。建議工程團隊參考 arXiv:2508.08029v1 並結合官方 O-RAN whitepaper，汲取最新實作細節，優化 xApp 安全性。

欲了解更多實戰經驗與工具應用，歡迎加入交流：https://www.okx.com/join?channelId=42974376