Class: CompletionKit::OpenRouterClient

Inherits:

LlmClient

Object
LlmClient
CompletionKit::OpenRouterClient

show all

Defined in:: app/services/completion_kit/open_router_client.rb

Constant Summary collapse

BASE_URL =

"https://openrouter.ai".freeze

REFERER =

"https://completionkit.com".freeze

APP_TITLE =

"CompletionKit".freeze

Instance Method Summary collapse

#available_models ⇒ Object
#configuration_errors ⇒ Object
#configured? ⇒ Boolean
#generate_completion(prompt, options = {}) ⇒ Object
#temperature_dropped? ⇒ Boolean

Methods inherited from LlmClient

for_model, for_provider, #initialize

Constructor Details

This class inherits a constructor from CompletionKit::LlmClient

Instance Method Details

#available_models ⇒ `Object`



55
56
57

# File 'app/services/completion_kit/open_router_client.rb', line 55

def available_models
  []
end

#configuration_errors ⇒ `Object`

# File 'app/services/completion_kit/open_router_client.rb', line 63

def configuration_errors
  errors = []
  errors << "OpenRouter API key is not configured" unless api_key.present?
  errors
end

#configured? ⇒ `Boolean`

Returns:

(Boolean)



59
60
61

# File 'app/services/completion_kit/open_router_client.rb', line 59

def configured?
  api_key.present?
end

#generate_completion(prompt, options = {}) ⇒ `Object`

# File 'app/services/completion_kit/open_router_client.rb', line 11

def generate_completion(prompt, options = {})
  @temperature_dropped = false
  return "Error: API key not configured" unless configured?

  model = options[:model] || "openai/gpt-4o-mini"
  max_tokens = options[:max_tokens] || 8192
  temperature = options[:temperature] || 0.7

  response = post_chat(model: model, prompt: prompt, max_tokens: max_tokens, temperature: temperature)

  if response.status == 400 && temperature_unsupported?(response.body)
    @temperature_dropped = true
    response = post_chat(model: model, prompt: prompt, max_tokens: max_tokens, temperature: nil)
  end

  if response.status == 429
    raise CompletionKit::RateLimitError.new(
      response.body.to_s.truncate(500),
      provider: "openrouter",
      status: 429,
      retry_after: response.headers && response.headers["Retry-After"]&.to_i
    )
  end

  if response.success?
    data = JSON.parse(response.body)
    choice = data.dig("choices", 0) || {}
    if choice["finish_reason"] == "length"
      return "Error: response truncated by max_tokens=#{max_tokens} before visible content was emitted (reasoning model burned through the budget)"
    end
    content = choice.dig("message", "content").to_s.strip
    return "Error: model returned empty content" if content.empty?
    content
  else
    "Error: #{response.status} - #{response.body}"
  end
rescue CompletionKit::RateLimitError
  raise
rescue Faraday::Error
  raise
rescue => e
  "Error: #{e.message}"
end

#temperature_dropped? ⇒ `Boolean`

Returns:

(Boolean)



7
8
9

# File 'app/services/completion_kit/open_router_client.rb', line 7

def temperature_dropped?
  @temperature_dropped == true
end

Class: CompletionKit::OpenRouterClient

Constant Summary collapse

Instance Method Summary collapse

Methods inherited from LlmClient

Constructor Details

Instance Method Details

#available_models ⇒ Object

#configuration_errors ⇒ Object

#configured? ⇒ Boolean

#generate_completion(prompt, options = {}) ⇒ Object

#temperature_dropped? ⇒ Boolean

#available_models ⇒ `Object`

#configuration_errors ⇒ `Object`

#configured? ⇒ `Boolean`

#generate_completion(prompt, options = {}) ⇒ `Object`

#temperature_dropped? ⇒ `Boolean`