工程开发数据分析自动化
gemini-audio
整合 Google Gemini API 音频处理功能:进行录音转文字、音频摘要、声音分析,并提供语音合成 (TTS) 功能以产生自然语音。
浏览: 15★ 1
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 500 个技能
整合 Google Gemini API 音频处理功能:进行录音转文字、音频摘要、声音分析,并提供语音合成 (TTS) 功能以产生自然语音。
LobeHub 项目架构与结构指南。用于探索代码库、理解项目组织、查找文件及获取架构背景信息。
用于设计代理工具的专业框架,优化工具描述、执行基于合约的 API,并实施架构精简以提高 AI 代理工具选择的准确性。
智能战略规划与需求收集,支持多视角共识循环与结构化审议。
交互式工作区探索指南,提供专家代理、自动化工作流程、CLI 工具及活动生命周期钩子的使用说明。
FlowGram.ai 自定义节点开发指南,支持简单节点自动表单与复杂节点自定义 UI 开发。
高效管理 git worktrees,支持自动化文件同步、后台任务执行以及基于 CLI 的工作区编排。
在独立会话中执行实施计划并进行审核检查点,确保逐项任务验证与代码质量。
使用 LlamaExtract 实现从 PDF、DOCX 和 PPTX 等非结构化文件中提取结构化数据的方案,并通过 Pydantic 定义数据架构。
使用 AI 模型(如 FLUX 和 Gemini)生成或编辑图像。适用于照片、插图、概念艺术和视觉素材,不包含技术图表或原理图。
AI 一键生成小红书爆款笔记,包含标题、正文、标签、封面提示词及发帖策略,真实种草风格,防封号优化。
基于 Gemini 的 UI 设计审核、无障碍审计与设计系统验证工具,专为软件代理设计。