Overview

Cases: GET/POST /api/skills/:id/evaluation-cases
Run batch: POST /api/skills/:id/evaluations/run
Fetch result: GET /api/skills/:id/evaluations/:evaluationRunId

Evaluations batch cases and run them against draft and/or published skill versions. They help you measure changes before you ship.

What you get

SDK: EvaluationsClient (evaluation runs are api_key_or_access_token; API keys require evaluations:write).