gemini-interactions-api
专门用于实现 Gemini Interactions API 的技能。适用于状态化多轮对话、后台 Deep Research 代理任务、函数调用、结构化输出,以及现代 Python 与 TypeScript SDK 的整合。
简介
Gemini Interactions API 技能为开发者提供构建代理应用程序的核心框架,使用 Google 最新的 Gemini 模型与集成代理。本技能旨在协助工程师与软件开发人员实现复杂、具有状态管理或后台执行需求的交互,超越简单的请求-响应模式。本技能涵盖交互的完整生命周期,从初始化 google-genai 或 @google/genai 客户端,到调度函数调用 (function calling) 与 Deep Research 代理等进阶工具使用功能。
-
完整支持状态化对话,利用服务器端的
previous_interaction_id来管理历史记录,无需手动追踪上下文。 -
优化后台任务的工作流程,特别是针对需要长时间执行的 Deep Research 代理,包括用于结果检索的轮询机制。
-
严格遵守当前的模型规格,包括 Gemini 3.1 Pro、Flash 以及专用的 Lite 或影像变体,并针对过时请求提供自动回退机制。
-
提供透过服务器发送事件 (SSE) 进行串流响应的实现指导,确保代理 UI 应用程序具备低延迟的使用体验。
-
提供利用结构化输出与函数调用的最佳实践,以便将模型与外部 API、数据库或 MCP 服务器集成。
-
支持最新的 Python 与 TypeScript SDK,明确避免使用已弃用的
google-generativeai函数库。 -
当您需要在聊天机器人或客户服务机器人中跨多轮维持对话状态时,请使用此技能。
-
在需要深度推理且需透过 Deep Research 代理进行自主信息收集的后台研究任务中,请利用此技能。
-
当需要透过函数调用将 Gemini 与外部数据源集成以执行实时数据库查询或工具代码执行时,请应用此技能。
-
请确保所有项目依赖包已更新以支持 Python 的
google-genai>= 1.55.0 或 JavaScript/TypeScript 的@google/genai>= 1.33.0。 -
请注意,旧版模型(如 Gemini 1.5、2.0)已严格弃用;此技能提供防护机制,可自动将其替换为
gemini-3-flash-preview,以维护性能与兼容性。
仓库统计
- Star 数
- 3,395
- Fork 数
- 316
- Open Issue 数
- 4
- 主要语言
- 未提供
- 默认分支
- main
- 同步状态
- 空闲
- 最近同步时间
- 2026年5月3日 02:21