evaluation
为 AI 代理构建系统化的评估框架,利用多维评分标准、LLM-as-a-judge 与回归测试,量测代理效能、质量及上下文工程的有效性。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 250 个技能
为 AI 代理构建系统化的评估框架,利用多维评分标准、LLM-as-a-judge 与回归测试,量测代理效能、质量及上下文工程的有效性。
高性能 Python 与 Rust 内存内 DataFrame 库。支持延迟计算、并行处理,并使用 Apache Arrow 引擎,适用于高效 ETL、数据处理及加速 pandas 工作流。
全栈网页开发套件,整合 Next.js (SSR/RSC/App Router)、Turborepo 单体库管理及 RemixIcon 图标库。专为现代 React 开发、高性能构建与可扩展架构设计。
这是一个友好的欢迎技能,当用户发送“hello”或“hi”时,会以 ASCII 艺术风格显示操作系统信息。
掌握现代 React 状态管理。学习使用 Redux Toolkit、Zustand、Jotai 和 React Query 来处理全局、服务器与本地状态。
将技术文档转化为增长引擎。学习撰写有助于SEO、缩短价值实现时间并透过优秀信息架构与开发者导向写作来提升转换率的文档。
基于 LSP 的符号级代码理解与导航工具,支持 30 多种编程语言,提供精准的符号查询、引用追踪与代码重构能力。
构建具有独特风格、生产级品质的前端界面与网页组件,强调高美学品质,并避免通用的人工智能设计模式。
启动自动化逆向工程,探索代码库架构、层级与技术栈,以利于系统现代化或文档编写。
使用 Qwen ASR 模型将音频文件 (wav, mp3, ogg) 转录为文本。快速、支持本地运行,无需 API 密钥。
自动化多团队代码库改进代理,具备狭义(目标导向)、广义(假设发散)及全面(质量扫描)三种模式。
利用费曼技巧、苏格拉底教学法与认知负载理论等大师级教学策略,将复杂概念转化为清晰易懂的解释。