Module: LlmCostTracker::Integrations::RubyLlm

Extended by:: Base

Defined in:: lib/llm_cost_tracker/integrations/ruby_llm.rb

Defined Under Namespace

Class Method Summary collapse

.integration_name ⇒ Object
.minimum_version ⇒ Object
.model_id(object) ⇒ Object
.patch_targets ⇒ Object
.provider_response_id(response) ⇒ Object
.provider_slug(provider) ⇒ Object
.record_completion(provider, response, request:, latency_ms:, stream:) ⇒ Object
.record_embedding(provider, response, request:, latency_ms:) ⇒ Object
.record_transcription(provider, response, request:, latency_ms:) ⇒ Object
.record_usage(provider:, model:, response:, latency_ms:, stream:, output_tokens: nil) ⇒ Object
.regular_input_tokens(input_tokens, cache_read) ⇒ Object
.response_model_id(object) ⇒ Object
.streaming_request?(request, has_block:) ⇒ Boolean
.usage_metadata(response, cache_read) ⇒ Object
.version_constant ⇒ Object

Methods included from Base

active?, constant, elapsed_ms, enforce_budget!, install, minimum_version, patch_target, patch_targets, record_safely, request_params, status, version_constant

Class Method Details

.integration_name ⇒ `Object`

11	# File 'lib/llm_cost_tracker/integrations/ruby_llm.rb', line 11 def integration_name = :ruby_llm

.minimum_version ⇒ `Object`

13	# File 'lib/llm_cost_tracker/integrations/ruby_llm.rb', line 13 def minimum_version = "1.14.1"

.model_id(object) ⇒ `Object`

# File 'lib/llm_cost_tracker/integrations/ruby_llm.rb', line 104

def model_id(object)
  return nil if object.nil?

  value = ObjectReader.first(object, :id, :model_id, :model)
  value ||= object if object.is_a?(String) || object.is_a?(Symbol)
  value&.to_s
end

.patch_targets ⇒ `Object`

# File 'lib/llm_cost_tracker/integrations/ruby_llm.rb', line 17

def patch_targets
  [
    patch_target(
      "RubyLLM::Provider",
      with: ProviderPatch,
      methods: %i[slug complete embed transcribe]
    )
  ]
end

.provider_response_id(response) ⇒ `Object`



117
118
119

# File 'lib/llm_cost_tracker/integrations/ruby_llm.rb', line 117

def provider_response_id(response)
  ObjectReader.first(response, :id, :provider_response_id) || ObjectReader.nested(response, :raw, :id)
end

.provider_slug(provider) ⇒ `Object`



100
101
102

# File 'lib/llm_cost_tracker/integrations/ruby_llm.rb', line 100

def provider_slug(provider)
  ObjectReader.first(provider, :slug).to_s
end

.record_completion(provider, response, request:, latency_ms:, stream:) ⇒ `Object`

# File 'lib/llm_cost_tracker/integrations/ruby_llm.rb', line 27

def record_completion(provider, response, request:, latency_ms:, stream:)
  record_usage(
    provider: provider_slug(provider),
    model: response_model_id(response) || model_id(request[:model]),
    response: response,
    latency_ms: latency_ms,
    stream: stream
  )
end

.record_embedding(provider, response, request:, latency_ms:) ⇒ `Object`

# File 'lib/llm_cost_tracker/integrations/ruby_llm.rb', line 41

def record_embedding(provider, response, request:, latency_ms:)
  record_usage(
    provider: provider_slug(provider),
    model: response_model_id(response) || model_id(request[:model]),
    response: response,
    latency_ms: latency_ms,
    stream: false,
    output_tokens: 0
  )
end

.record_transcription(provider, response, request:, latency_ms:) ⇒ `Object`

# File 'lib/llm_cost_tracker/integrations/ruby_llm.rb', line 52

def record_transcription(provider, response, request:, latency_ms:)
  record_usage(
    provider: provider_slug(provider),
    model: response_model_id(response) || model_id(request[:model]),
    response: response,
    latency_ms: latency_ms,
    stream: false
  )
end

.record_usage(provider:, model:, response:, latency_ms:, stream:, output_tokens: nil) ⇒ `Object`

# File 'lib/llm_cost_tracker/integrations/ruby_llm.rb', line 62

def record_usage(provider:, model:, response:, latency_ms:, stream:, output_tokens: nil)
  return unless active?

  record_safely do
    input_tokens = ObjectReader.first(response, :input_tokens)
    output_tokens = ObjectReader.first(response, :output_tokens) if output_tokens.nil?
    next if input_tokens.nil? && output_tokens.nil?

    cache_read = ObjectReader.integer(ObjectReader.first(response, :cached_tokens))

    LlmCostTracker::Tracker.record(
      provider: provider,
      model: model,
      input_tokens: regular_input_tokens(input_tokens, cache_read),
      output_tokens: ObjectReader.integer(output_tokens),
      latency_ms: latency_ms,
      stream: stream,
      usage_source: :ruby_llm,
      provider_response_id: provider_response_id(response),
      metadata: usage_metadata(response, cache_read)
    )
  end
end

.regular_input_tokens(input_tokens, cache_read) ⇒ `Object`



96
97
98

# File 'lib/llm_cost_tracker/integrations/ruby_llm.rb', line 96

def regular_input_tokens(input_tokens, cache_read)
  [ObjectReader.integer(input_tokens) - cache_read.to_i, 0].max
end

.response_model_id(object) ⇒ `Object`

# File 'lib/llm_cost_tracker/integrations/ruby_llm.rb', line 112

def response_model_id(object)
  value = ObjectReader.first(object, :model_id, :model)
  value&.to_s
end

.streaming_request?(request, has_block:) ⇒ `Boolean`

Returns:

(Boolean)



37
38
39

# File 'lib/llm_cost_tracker/integrations/ruby_llm.rb', line 37

def streaming_request?(request, has_block:)
  has_block || request[:stream] == true
end

.usage_metadata(response, cache_read) ⇒ `Object`

# File 'lib/llm_cost_tracker/integrations/ruby_llm.rb', line 86

def usage_metadata(response, cache_read)
  {
    cache_read_input_tokens: cache_read,
    cache_write_input_tokens: ObjectReader.integer(ObjectReader.first(response, :cache_creation_tokens)),
    hidden_output_tokens: ObjectReader.integer(
      ObjectReader.first(response, :thinking_tokens, :reasoning_tokens)
    )
  }
end

.version_constant ⇒ `Object`

15	# File 'lib/llm_cost_tracker/integrations/ruby_llm.rb', line 15 def version_constant = "RubyLLM::VERSION"

Module: LlmCostTracker::Integrations::RubyLlm

Defined Under Namespace

Class Method Summary collapse

Methods included from Base

Class Method Details

.integration_name ⇒ Object

.minimum_version ⇒ Object

.model_id(object) ⇒ Object

.patch_targets ⇒ Object

.provider_response_id(response) ⇒ Object

.provider_slug(provider) ⇒ Object

.record_completion(provider, response, request:, latency_ms:, stream:) ⇒ Object

.record_embedding(provider, response, request:, latency_ms:) ⇒ Object

.record_transcription(provider, response, request:, latency_ms:) ⇒ Object

.record_usage(provider:, model:, response:, latency_ms:, stream:, output_tokens: nil) ⇒ Object

.regular_input_tokens(input_tokens, cache_read) ⇒ Object

.response_model_id(object) ⇒ Object

.streaming_request?(request, has_block:) ⇒ Boolean

.usage_metadata(response, cache_read) ⇒ Object

.version_constant ⇒ Object

.integration_name ⇒ `Object`

.minimum_version ⇒ `Object`

.model_id(object) ⇒ `Object`

.patch_targets ⇒ `Object`

.provider_response_id(response) ⇒ `Object`

.provider_slug(provider) ⇒ `Object`

.record_completion(provider, response, request:, latency_ms:, stream:) ⇒ `Object`

.record_embedding(provider, response, request:, latency_ms:) ⇒ `Object`

.record_transcription(provider, response, request:, latency_ms:) ⇒ `Object`

.record_usage(provider:, model:, response:, latency_ms:, stream:, output_tokens: nil) ⇒ `Object`

.regular_input_tokens(input_tokens, cache_read) ⇒ `Object`

.response_model_id(object) ⇒ `Object`

.streaming_request?(request, has_block:) ⇒ `Boolean`

.usage_metadata(response, cache_read) ⇒ `Object`

.version_constant ⇒ `Object`