gemini-interactions-api

简介

Gemini Interactions API 技能为开发者提供构建代理应用程序的核心框架，使用 Google 最新的 Gemini 模型与集成代理。本技能旨在协助工程师与软件开发人员实现复杂、具有状态管理或后台执行需求的交互，超越简单的请求-响应模式。本技能涵盖交互的完整生命周期，从初始化 google-genai 或 @google/genai 客户端，到调度函数调用 (function calling) 与 Deep Research 代理等进阶工具使用功能。

完整支持状态化对话，利用服务器端的 previous_interaction_id 来管理历史记录，无需手动追踪上下文。
优化后台任务的工作流程，特别是针对需要长时间执行的 Deep Research 代理，包括用于结果检索的轮询机制。
严格遵守当前的模型规格，包括 Gemini 3.1 Pro、Flash 以及专用的 Lite 或影像变体，并针对过时请求提供自动回退机制。
提供透过服务器发送事件 (SSE) 进行串流响应的实现指导，确保代理 UI 应用程序具备低延迟的使用体验。
提供利用结构化输出与函数调用的最佳实践，以便将模型与外部 API、数据库或 MCP 服务器集成。
支持最新的 Python 与 TypeScript SDK，明确避免使用已弃用的 google-generativeai 函数库。
当您需要在聊天机器人或客户服务机器人中跨多轮维持对话状态时，请使用此技能。
在需要深度推理且需透过 Deep Research 代理进行自主信息收集的后台研究任务中，请利用此技能。
当需要透过函数调用将 Gemini 与外部数据源集成以执行实时数据库查询或工具代码执行时，请应用此技能。
请确保所有项目依赖包已更新以支持 Python 的 google-genai >= 1.55.0 或 JavaScript/TypeScript 的 @google/genai >= 1.33.0。
请注意，旧版模型（如 Gemini 1.5、2.0）已严格弃用；此技能提供防护机制，可自动将其替换为 gemini-3-flash-preview，以维护性能与兼容性。

创业课程

在线课程

实体课程

gemini-interactions-api

简介

仓库统计