工程開發
advanced-evaluation avatar

advanced-evaluation

實作生產級別的 LLM-as-a-Judge 系統,用於自動化品質評估、模型輸出比較、評分標準生成以及系統性偏差修正。

每日活動

最近 30 天的瀏覽與下載趨勢。

日期瀏覽下載
4月29日00
4月28日00
4月27日00
4月26日00
4月25日00
4月24日00
4月23日00
4月22日00
4月21日00
4月20日00
4月19日00
4月18日00
4月17日00
4月16日00
4月15日00
4月14日00
4月13日00
4月12日00
4月11日00
4月10日00
4月9日00
4月8日00
4月7日00
4月6日00
4月5日00
4月4日00
4月3日00
4月2日00
4月1日00
3月31日00