工程开发
gemini-interactions-api avatar

gemini-interactions-api

专门用于实现 Gemini Interactions API 的技能。适用于状态化多轮对话、后台 Deep Research 代理任务、函数调用、结构化输出,以及现代 Python 与 TypeScript SDK 的整合。

简介

Gemini Interactions API 技能为开发者提供构建代理应用程序的核心框架,使用 Google 最新的 Gemini 模型与集成代理。本技能旨在协助工程师与软件开发人员实现复杂、具有状态管理或后台执行需求的交互,超越简单的请求-响应模式。本技能涵盖交互的完整生命周期,从初始化 google-genai@google/genai 客户端,到调度函数调用 (function calling) 与 Deep Research 代理等进阶工具使用功能。

  • 完整支持状态化对话,利用服务器端的 previous_interaction_id 来管理历史记录,无需手动追踪上下文。

  • 优化后台任务的工作流程,特别是针对需要长时间执行的 Deep Research 代理,包括用于结果检索的轮询机制。

  • 严格遵守当前的模型规格,包括 Gemini 3.1 Pro、Flash 以及专用的 Lite 或影像变体,并针对过时请求提供自动回退机制。

  • 提供透过服务器发送事件 (SSE) 进行串流响应的实现指导,确保代理 UI 应用程序具备低延迟的使用体验。

  • 提供利用结构化输出与函数调用的最佳实践,以便将模型与外部 API、数据库或 MCP 服务器集成。

  • 支持最新的 Python 与 TypeScript SDK,明确避免使用已弃用的 google-generativeai 函数库。

  • 当您需要在聊天机器人或客户服务机器人中跨多轮维持对话状态时,请使用此技能。

  • 在需要深度推理且需透过 Deep Research 代理进行自主信息收集的后台研究任务中,请利用此技能。

  • 当需要透过函数调用将 Gemini 与外部数据源集成以执行实时数据库查询或工具代码执行时,请应用此技能。

  • 请确保所有项目依赖包已更新以支持 Python 的 google-genai >= 1.55.0 或 JavaScript/TypeScript 的 @google/genai >= 1.33.0。

  • 请注意,旧版模型(如 Gemini 1.5、2.0)已严格弃用;此技能提供防护机制,可自动将其替换为 gemini-3-flash-preview,以维护性能与兼容性。

仓库统计

Star 数
3,395
Fork 数
316
Open Issue 数
4
主要语言
未提供
默认分支
main
同步状态
空闲
最近同步时间
2026年5月3日 02:21
在 GitHub 查看