内容创作
youtube_moderation_prototype
YouTube 直播聊天室自动化审核原型,运用模式识别检测垃圾信息、有害内容与流量限制,专为部署前测试代理性能而设计。
简介
本审核原型旨在通过结构化、基于规则的过滤方法,维护 YouTube 社区环境的健康与安全。作为测试框架,它允许开发者在将逻辑移植到原生 Qwen 或 Gemma 环境之前,验证模式保真度与分类准确性。通过执行严格的验证步骤,该技能确保在识别破坏性行为时具有高精确度,同时为合法的用户互动保持极低的误报率。
-
大写垃圾信息检测:识别并拦截超过长度阈值且包含高比例大写字符的信息。
-
重复信息检测:监控聊天历史记录,通过侦测重复且精确匹配的短语来减轻垃圾信息行为。
-
流量限制检测:通过对在 30 秒窗口内超过定义信息频率的用户发出警告或拦截,来强制执行流量控制。
-
有害内容检测:将传入的信息与可配置的关键字列表进行比对,以高信心度识别并拦截有害、有毒或冒犯性的语言。
-
合法信息路由:自动识别安全内容并将其路由至闲聊或互动服务,确保无缝的社区互动。
-
此技能要求针对 110 个预定义测试案例(包括垃圾信息、毒性内容与合法对话)进行高保真度评估(>= 90%)。
-
专为与 0102 代理集群框架整合而设计,实现跨平台的自动化审核。
-
输入为即时聊天流;输出为结构化 JSON 日志,识别决策(拦截/允许/警告)、原因以及审计用的信心分数。
-
本模块严格属于测试验证用途的原型;应整合至更广泛的 WSP (Windsurf Recursive Engine) 工作流中以进行生产级部署。
-
使用者应确保正确加载 toxic_patterns.json,以管理针对不断演变的审核需求的模糊与精确关键字匹配。
仓库统计
- Star 数
- 1
- Fork 数
- 0
- Open Issue 数
- 6
- 主要语言
- Python
- 默认分支
- main
- 同步状态
- 空闲
- 最近同步时间
- 2026年5月3日 23:08