工程开发
advanced-evaluation
实现生产级别的 LLM-as-a-judge 模型评估流水线,包含配对比较、直接评分、偏差缓解与评分标准生成。
每日活动
最近 30 天的浏览与下载趋势。
| 日期 | 浏览 | 下载 |
|---|---|---|
| 6月17日 | 0 | 0 |
| 6月16日 | 0 | 0 |
| 6月15日 | 0 | 0 |
| 6月14日 | 1 | 0 |
| 6月13日 | 0 | 0 |
| 6月12日 | 0 | 0 |
| 6月11日 | 0 | 0 |
| 6月10日 | 0 | 0 |
| 6月9日 | 0 | 0 |
| 6月8日 | 0 | 0 |
| 6月7日 | 0 | 0 |
| 6月6日 | 1 | 0 |
| 6月5日 | 0 | 0 |
| 6月4日 | 0 | 0 |
| 6月3日 | 0 | 0 |
| 6月2日 | 0 | 0 |
| 6月1日 | 0 | 0 |
| 5月31日 | 0 | 0 |
| 5月30日 | 0 | 0 |
| 5月29日 | 0 | 0 |
| 5月28日 | 0 | 0 |
| 5月27日 | 0 | 0 |
| 5月26日 | 0 | 1 |
| 5月25日 | 0 | 0 |
| 5月24日 | 0 | 0 |
| 5月23日 | 0 | 0 |
| 5月22日 | 0 | 0 |
| 5月21日 | 0 | 0 |
| 5月20日 | 0 | 0 |
| 5月19日 | 1 | 0 |