Module: Legion::LLM::Call::Embeddings

Extended by:: Legion::Logging::Helper

Defined in:: lib/legion/llm/call/embeddings.rb

Constant Summary collapse

PREFIX_REGISTRY =

{
  'nomic-embed-text'  => { document: 'search_document: ', query: 'search_query: ' },
  'mxbai-embed-large' => { query: 'Represent this sentence for searching relevant passages: ' }
}.freeze

Class Method Summary collapse

.default_model ⇒ Object
.generate(text:, model: nil, provider: nil, instance: nil, dimensions: nil, task: :document) ⇒ Object
.generate_batch(texts:, model: nil, provider: nil, instance: nil, dimensions: nil, task: :document) ⇒ Object

Class Method Details

.default_model ⇒ `Object`



97
98
99

# File 'lib/legion/llm/call/embeddings.rb', line 97

def default_model
  resolve_model
end

.generate(text:, model: nil, provider: nil, instance: nil, dimensions: nil, task: :document) ⇒ `Object`

# File 'lib/legion/llm/call/embeddings.rb', line 19

def generate(text:, model: nil, provider: nil, instance: nil,
             dimensions: nil, task: :document)
  return not_started_result(model, provider) unless LLM.started?

  provider ||= resolve_provider
  return unavailable_result(model, provider) unless provider

  model ||= resolve_model
  text_length = text.to_s.length
  text = apply_prefix(coerce_text(text), model: model, task: task)

  log.info("[llm][embed] action=generate provider=#{provider} instance=#{instance || 'default'} " \
           "model=#{model} task=#{task} text_chars=#{text_length}")

  started_at = ::Process.clock_gettime(::Process::CLOCK_MONOTONIC)
  response = Dispatch.call(
    provider:   provider,
    instance:   instance,
    capability: :embed,
    model:      model,
    text:       text,
    dimensions: dimensions
  )
  elapsed = ((::Process.clock_gettime(::Process::CLOCK_MONOTONIC) - started_at) * 1000).round(1)

  vector = normalize_vector(response[:result])
  vector = enforce_dimensions(vector) if enforce_dimension?
  tokens = extract_tokens(response)

  log.info("[llm][embed] action=generate.complete provider=#{provider} instance=#{instance || 'default'} " \
           "model=#{model} dimensions=#{vector&.size || 0} tokens=#{tokens} duration_ms=#{elapsed}")

  {
    vector:     vector,
    model:      model,
    provider:   provider,
    dimensions: vector&.size || 0,
    tokens:     tokens
  }
rescue StandardError => e
  handle_exception(e, level: :warn, operation: 'llm.embeddings.generate')
  { vector: nil, model: model, provider: provider, error: e.message }
end

.generate_batch(texts:, model: nil, provider: nil, instance: nil, dimensions: nil, task: :document) ⇒ `Object`

# File 'lib/legion/llm/call/embeddings.rb', line 63

def generate_batch(texts:, model: nil, provider: nil, instance: nil,
                   dimensions: nil, task: :document)
  return texts.map { { vector: nil, error: 'LLM not started' } } unless LLM.started?

  provider ||= resolve_provider
  model ||= resolve_model

  log.info("[llm][embed] action=generate_batch provider=#{provider} instance=#{instance || 'default'} " \
           "model=#{model} count=#{texts.size} task=#{task}")

  texts = texts.map { |t| apply_prefix(coerce_text(t), model: model, task: task) }

  started_at = ::Process.clock_gettime(::Process::CLOCK_MONOTONIC)
  response = Dispatch.call(
    provider:   provider,
    instance:   instance,
    capability: :embed,
    model:      model,
    text:       texts,
    dimensions: dimensions
  )
  elapsed = ((::Process.clock_gettime(::Process::CLOCK_MONOTONIC) - started_at) * 1000).round(1)

  result = normalize_batch(response[:result], model, provider)

  log.info("[llm][embed] action=generate_batch.complete provider=#{provider} " \
           "model=#{model} count=#{result.size} duration_ms=#{elapsed}")

  result
rescue StandardError => e
  handle_exception(e, level: :warn, operation: 'llm.embeddings.generate_batch')
  texts.map { { vector: nil, model: model, provider: provider, error: e.message } }
end

Module: Legion::LLM::Call::Embeddings

Constant Summary collapse

Class Method Summary collapse

Class Method Details

.default_model ⇒ Object

.generate(text:, model: nil, provider: nil, instance: nil, dimensions: nil, task: :document) ⇒ Object

.generate_batch(texts:, model: nil, provider: nil, instance: nil, dimensions: nil, task: :document) ⇒ Object

.default_model ⇒ `Object`

.generate(text:, model: nil, provider: nil, instance: nil, dimensions: nil, task: :document) ⇒ `Object`

.generate_batch(texts:, model: nil, provider: nil, instance: nil, dimensions: nil, task: :document) ⇒ `Object`