研究
ai-writing-detection avatar

ai-writing-detection

全面的 AI 文本檢測框架。透過詞彙分析、結構模式、模型指紋與技術後設資料比對,精準辨識 AI 生成內容與寫作痕跡。

簡介

此技能提供用於辨識 AI 生成內容的專業知識庫與分析方法論。透過多層次驗證策略,將語言特徵與生成文本中內嵌的技術後設資料(Metadata)進行關聯分析,超越簡單的啟發式檢查。本工具專為研究人員、內容審核者與技術寫作者設計,協助評估資訊來源並維持人類創作的完整性。

  • 技術後設資料掃描:直接偵測明確的 AI 標記,例如 ChatGPT/GPT-4 的輸出特徵(turn0search, oaicite, utm_source 追蹤碼)、Grok 專用 XML 標籤及 Markdown 結構異常。

  • 語言模式比對:分析高訊號 AI 詞彙(如「delve」、「tapestry」)、重複的三段式結構(tricolon)、負面平行句法與同義詞循環替換。

  • 模型特徵指紋:識別各主流 AI 平台的特定風格傾向,區分 Claude 的嚴謹語調與 Gemini 的事實密集式對話合成風格。

  • 多層次信心評分:涵蓋九個分析維度,包括句子長度變異度(Burstiness)、格式異常(標題首字母大寫過度、行內標題列表)與引用完整性(DOI/ISBN 校驗碼檢查)。

  • 誤判防範:提供區分人類創作習慣與演算法模式的指導方針,確保分析的客觀性。

  • 適用於審核文件、驗證資訊可靠度,或分析不同 LLM 架構的風格足跡。

  • 輸入通常為原始文字字串;輸出則提供基於信心加權的 AI 生成訊號分析結果。

  • 建議在下結論前交互驗證多個層級(Layer 1-9),因單一特徵也可能出現在人類的創意寫作中。

  • 此方法論針對偵測常見缺陷進行優化,包括「重要性誇飾」、「挑戰與未來」模板化結構,以及預留佔位符的參考資料。

倉庫統計

Star 數
1,108
Fork 數
100
Open Issue 數
4
主要語言
Python
預設分支
main
同步狀態
閒置
最近同步時間
2026年5月1日 上午07:17
在 GitHub 查看