工程開發
advanced-evaluation avatar

advanced-evaluation

實作生產級別的 LLM-as-a-judge 模型評估管線,包含配對比較、直接評分、偏差緩解與評分標準生成。

每日活動

最近 30 天的瀏覽與下載趨勢。

日期瀏覽下載
6月17日00
6月16日00
6月15日00
6月14日10
6月13日00
6月12日00
6月11日00
6月10日00
6月9日00
6月8日00
6月7日00
6月6日10
6月5日00
6月4日00
6月3日00
6月2日00
6月1日00
5月31日00
5月30日00
5月29日00
5月28日00
5月27日00
5月26日01
5月25日00
5月24日00
5月23日00
5月22日00
5月21日00
5月20日00
5月19日10