工程開發
gemini-interactions-api avatar

gemini-interactions-api

專門用於實作 Gemini Interactions API 的技能。適用於狀態化多輪對話、背景 Deep Research 代理任務、函數呼叫、結構化輸出,以及現代 Python 與 TypeScript SDK 的整合。

簡介

Gemini Interactions API 技能為開發者提供構建代理應用程式的核心框架,使用 Google 最新的 Gemini 模型與整合代理。本技能旨在協助工程師與軟體開發人員實現複雜、具有狀態管理或背景執行需求的互動,超越簡單的請求-回應模式。本技能涵蓋互動的完整生命週期,從初始化 google-genai@google/genai 客戶端,到調度函數呼叫 (function calling) 與 Deep Research 代理等進階工具使用功能。

  • 完整支援狀態化對話,利用伺服器端的 previous_interaction_id 來管理歷史記錄,無需手動追蹤上下文。

  • 優化背景任務的工作流程,特別是針對需要長時間執行的 Deep Research 代理,包括用於結果檢索的輪詢機制。

  • 嚴格遵守當前的模型規格,包括 Gemini 3.1 Pro、Flash 以及專用的 Lite 或影像變體,並針對過時請求提供自動回退機制。

  • 提供透過伺服器傳送事件 (SSE) 進行串流回應的實作指導,確保代理 UI 應用程式具備低延遲的使用體驗。

  • 提供利用結構化輸出與函數呼叫的最佳實踐,以便將模型與外部 API、資料庫或 MCP 伺服器整合。

  • 支援最新的 Python 與 TypeScript SDK,明確避免使用已棄用的 google-generativeai 函式庫。

  • 當您需要在聊天機器人或客戶服務機器人中跨多輪維持對話狀態時,請使用此技能。

  • 在需要深度推理且需透過 Deep Research 代理進行自主資訊收集的背景研究任務中,請利用此技能。

  • 當需要透過函數呼叫將 Gemini 與外部資料源整合以執行即時資料庫查詢或工具程式碼執行時,請應用此技能。

  • 請確保所有專案相依套件已更新以支援 Python 的 google-genai >= 1.55.0 或 JavaScript/TypeScript 的 @google/genai >= 1.33.0。

  • 請注意,舊版模型(如 Gemini 1.5、2.0)已嚴格棄用;此技能提供防護機制,可自動將其替換為 gemini-3-flash-preview,以維護效能與相容性。

倉庫統計

Star 數
3,395
Fork 數
316
Open Issue 數
4
主要語言
未提供
預設分支
main
同步狀態
閒置
最近同步時間
2026年5月3日 上午02:21
在 GitHub 查看