youtube_moderation_prototype

簡介

本審核原型旨在透過結構化、基於規則的過濾方法，維持 YouTube 社群環境的健康與安全。作為測試框架，它允許開發者在將邏輯移植到原生 Qwen 或 Gemma 環境之前，驗證模式保真度與分類準確性。透過執行嚴格的驗證步驟，該技能確保在識別破壞性行為時具有高精確度，同時為合法的使用者互動保持極低的誤報率。

大寫垃圾訊息檢測：識別並攔截超過長度閾值且包含高比例大寫字元的訊息。
重複訊息檢測：監控聊天歷史記錄，透過偵測重複且精確匹配的短語來減輕垃圾訊息行為。
流量限制檢測：透過對在 30 秒窗口內超過定義訊息頻率的使用者發出警告或攔截，來強制執行流量控制。
有害內容檢測：將傳入的訊息與可配置的關鍵字列表進行比對，以高信心度識別並攔截有害、有毒或冒犯性的語言。
合法訊息路由：自動識別安全內容並將其路由至閒聊或互動服務，確保無縫的社群互動。
此技能要求針對 110 個預定義測試案例（包括垃圾訊息、毒性內容與合法對話）進行高保真度評估（>= 90%）。
專為與 0102 代理集群框架整合而設計，實現跨平台的自動化審核。
輸入為即時聊天串流；輸出為結構化 JSON 日誌，識別決策（攔截/允許/警告）、原因以及稽核用的信心分數。
本模組嚴格屬於測試驗證用途的原型；應整合至更廣泛的 WSP (Windsurf Recursive Engine) 工作流中以進行生產級部署。
使用者應確保正確載入 toxic_patterns.json，以管理針對不斷演變的審核需求的模糊與精確關鍵字匹配。

創業課程

網上課程

實體課程

youtube_moderation_prototype

簡介

倉庫統計