Agent Skills Hub

Discover reusable agent skills, browse implementation details, and find the right skill for your workflow.

121 skills found

gemini-api

Google Gemini Image Generation API interface for text-to-image, editing, style templates, and automated retry workflows.

Views: 33★ 255

EngineeringAutomation

gemini-interactions-api

Expert skill for implementing the Gemini Interactions API. Use for stateful multi-turn chat, background Deep Research agent tasks, function calling, structured outputs, and modern Python/TypeScript SDK integration.

Views: 41★ 3,395

ProductivityEngineeringAutomation

gemini

CLI interface for Gemini AI, enabling one-shot model inference, text generation, and JSON-formatted data extraction for OpenClaw users.

Views: 42★ 366,013

ProductivityEngineeringData AnalysisContentResearch

ai-multimodal

Process and generate multimedia with Google Gemini. Analyze audio, images, videos, and PDFs with high-context windows. Supports transcription, visual QA, OCR, and AI-driven image creation.

Views: 14★ 9

EngineeringData AnalysisAutomation

gemini-audio

Implement Google Gemini API audio capabilities: process, transcribe, and summarize audio files, analyze environmental sounds, and generate natural speech with controllable TTS.

Views: 15★ 1

EngineeringData AnalysisAutomation

gemini-vision

Implement Google Gemini API vision capabilities for image/document analysis including captioning, object detection, segmentation, and multi-image comparison.

Views: 25★ 1

EngineeringContentData Analysis

nano-banana-pro

Generate and edit images, diagrams, and infographics using Google's Gemini 3 Pro model. Supports text-to-image, style transformation, and data-accurate visual creation.

Views: 7★ 7

EngineeringAutomationProductivity

gemini-manager

Claude Code as an architect: delegate all coding and file edits to the Gemini CLI while maintaining control through planning, verification, and oversight.

Views: 39★ 60

ContentAutomationProductivity

nanaban

Generate and edit images using the Gemini API via the nanaban CLI. Create illustrations, logos, and icons, or perform photo edits like background removal and style transfer.

ContentEducation

food-diorama-skill

Generate artistic 3D city-themed food diorama images using Google Gemini API. Creates Pop Mart style four-quadrant layouts featuring iconic dishes, cultural symbols, and city-specific heritage elements.

Views: 16★ 18

ContentMarketingProductivity