gemini-audio
整合 Google Gemini API 音频处理功能:进行录音转文字、音频摘要、声音分析,并提供语音合成 (TTS) 功能以产生自然语音。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 531 个技能
整合 Google Gemini API 音频处理功能:进行录音转文字、音频摘要、声音分析,并提供语音合成 (TTS) 功能以产生自然语音。
执行基于 Gradle 的 Java 测试,过滤失败结果与关键统计数据,并提供精简报告以简化后端开发与调试。
积极精简输入内容中的语法结构与冗余文字,在保留核心语义的同时优化 LLM 的 Token 使用效率。
实现生产级 AI 代理。包含 LangGraph、工具调用护栏、SSE 流式传输、情节记忆与 pgvector。提供反模式分析与修正代码。
React 与 Vite 性能优化指南。适用于编写、审查或优化基于 Vite 构建的 React 组件。
一个基于 Quartz v4 高度定制化的数字花园,支持增强型 Markdown 解析、缩放文本、TikZ 与伪代码渲染,并整合了 Obsidian 插件生态。
基于 DuckDB 的持久化状态管理与工作流程分析工具,支持任务依赖追踪、历史指标与上下文检查点功能。
MCP Gateway 设计模式,用于管理 Agent Gateway、子进程 (Subprocess) 及 Daemon 隔离策略,以优化上下文 Token 使用与系统性能。
使用 LlamaExtract 实现从 PDF、DOCX 和 PPTX 等非结构化文件中提取结构化数据的方案,并通过 Pydantic 定义数据架构。
前端状态管理指南,涵盖 Zustand/Pinia 全局存储、TanStack Query 服务器状态以及 URL 状态处理。
进阶多语言调试支持,包含堆栈追踪分析、运行时错误分类,以及针对容器与分布式系统的自动化诊断工具。
使用 Playwright 和 serve-web 自动截取高质量 VS Code 屏幕截图,适用于文档、演示文稿及技术视觉内容。