Class: SkillBench::Services::RunnerService

Inherits:

Object

Object
SkillBench::Services::RunnerService

show all

Defined in:: lib/skill_bench/services/runner_service.rb

Overview

Orchestrates the execution of an eval with baseline and context runs. Coordinates multiple services to resolve entities, spawn agents, and evaluate results.

Defined Under Namespace

Classes: EvaluationContext

Class Method Summary collapse

.call(eval_name:, skill_names:, pack: nil, registry_manifest: nil) ⇒ Hash

Runs an eval with the given parameters.

Instance Method Summary collapse

#call ⇒ Hash

Executes the eval: resolves entities, runs baseline and context, evaluates.
#initialize(eval_name:, skill_names:, pack: nil, registry_manifest: nil) ⇒ RunnerService constructor

A new instance of RunnerService.

Constructor Details

#initialize(eval_name:, skill_names:, pack: nil, registry_manifest: nil) ⇒ `RunnerService`

Returns a new instance of RunnerService.

Parameters:

eval_name (String) —

Name or path of the eval
skill_names (Array<String>) —

Names of the skills
pack (String, nil) (defaults to: nil) —

Optional pack name
registry_manifest (String, nil) (defaults to: nil) —

Optional registry.json path

# File 'lib/skill_bench/services/runner_service.rb', line 42

def initialize(eval_name:, skill_names:, pack: nil, registry_manifest: nil)
  @eval_name = eval_name
  @skill_names = skill_names
  @pack = pack
  @registry_manifest = registry_manifest
end

Class Method Details

.call(eval_name:, skill_names:, pack: nil, registry_manifest: nil) ⇒ `Hash`

Runs an eval with the given parameters.

Parameters:

eval_name (String) —

Name or path of the eval to run
skill_names (Array<String>) —

Names of the skills to use
pack (String, nil) (defaults to: nil) —

Optional pack name for registry-based skill resolution
registry_manifest (String, nil) (defaults to: nil) —

Optional path to registry.json manifest

Returns:

(Hash) —

Result from EvaluationRunner

# File 'lib/skill_bench/services/runner_service.rb', line 29

def self.call(eval_name:, skill_names:, pack: nil, registry_manifest: nil)
  new(
    eval_name: eval_name,
    skill_names: skill_names,
    pack: pack,
    registry_manifest: registry_manifest
  ).call
end

Instance Method Details

#call ⇒ `Hash`

Executes the eval: resolves entities, runs baseline and context, evaluates.