Module: RubyLLM::Providers::OpenAIResponses::Chat

Included in:: RubyLLM::Providers::OpenAIResponses

Defined in:: lib/ruby_llm/providers/openai_responses/chat.rb

Overview

Chat completion methods for the OpenAI Responses API. Handles converting RubyLLM messages to Responses API format and parsing responses.

Class Method Summary collapse

.apply_tools(payload, tools, tool_prefs) ⇒ Object

Apply tools and tool preferences to the payload.
.build_schema_format(schema) ⇒ Object

Build the Responses API text format block from a schema.
.build_tool_choice(choice) ⇒ Object

Convert a RubyLLM tool choice symbol to the Responses API format.
.extract_last_response_id(messages) ⇒ Object
.extract_output_text(output) ⇒ Object
.extract_text_content(content) ⇒ Object
.extract_tool_calls(output) ⇒ Object
.format_input(messages) ⇒ Object

rubocop:disable Metrics/MethodLength.
.format_message_content(content, tool_calls = nil) ⇒ Object
.format_role(role) ⇒ Object
.parse_arguments(arguments) ⇒ Object
.parse_completion_response(response) ⇒ Object
.render_payload(messages, tools:, temperature:, model:, stream: false, schema: nil, thinking: nil, tool_prefs: nil) ⇒ Object

rubocop:disable Metrics/ParameterLists.
.unchained_messages(messages, last_response_id) ⇒ Object

When chaining via previous_response_id, the API expects only the new items in ‘input` – the rest already lives in the server-side response chain.

Instance Method Summary collapse

#completion_url ⇒ Object

Class Method Details

.apply_tools(payload, tools, tool_prefs) ⇒ `Object`

Apply tools and tool preferences to the payload.

# File 'lib/ruby_llm/providers/openai_responses/chat.rb', line 43

def apply_tools(payload, tools, tool_prefs)
  return unless tools.any?

  payload[:tools] = tools.map { |_, tool| Tools.tool_for(tool) }
  payload[:tool_choice] = build_tool_choice(tool_prefs[:choice]) unless tool_prefs[:choice].nil?
  payload[:parallel_tool_calls] = tool_prefs[:calls] == :many unless tool_prefs[:calls].nil?
end

.build_schema_format(schema) ⇒ `Object`

Build the Responses API text format block from a schema. Schema arrives pre-normalized as { name:, schema:, strict: } from RubyLLM::Chat.with_schema (v1.13+), or as a raw hash (legacy).

# File 'lib/ruby_llm/providers/openai_responses/chat.rb', line 66

def build_schema_format(schema)
  schema_name = schema[:name] || 'response'
  schema_def = schema[:schema] || schema
  strict = schema.key?(:strict) ? schema[:strict] : true

  {
    format: {
      type: 'json_schema',
      name: schema_name,
      schema: schema_def,
      strict: strict
    }
  }
end

.build_tool_choice(choice) ⇒ `Object`

Convert a RubyLLM tool choice symbol to the Responses API format. Responses API accepts “auto”, “required”, “none”, or { type: “function”, name: “fn_name” } for a specific function.

# File 'lib/ruby_llm/providers/openai_responses/chat.rb', line 54

def build_tool_choice(choice)
  case choice
  when :auto, :none, :required
    choice.to_s
  else
    { type: 'function', name: choice.to_s }
  end
end

.extract_last_response_id(messages) ⇒ `Object`

# File 'lib/ruby_llm/providers/openai_responses/chat.rb', line 81

def extract_last_response_id(messages)
  messages
    .select { |m| m.role == :assistant && m.respond_to?(:response_id) }
    .map(&:response_id)
    .compact
    .last
end

.extract_output_text(output) ⇒ `Object`

# File 'lib/ruby_llm/providers/openai_responses/chat.rb', line 237

def extract_output_text(output)
  output
    .select { |item| item['type'] == 'message' }
    .flat_map { |item| item['content'] || [] }
    .select { |c| c['type'] == 'output_text' }
    .map { |c| c['text'] }
    .join
end

.extract_text_content(content) ⇒ `Object`

# File 'lib/ruby_llm/providers/openai_responses/chat.rb', line 215

def extract_text_content(content)
  case content
  when String
    content
  when RubyLLM::Content
    content.text
  when Hash
    content[:text] || content['text']
  else
    content.to_s
  end
end

.extract_tool_calls(output) ⇒ `Object`

# File 'lib/ruby_llm/providers/openai_responses/chat.rb', line 246

def extract_tool_calls(output)
  function_calls = output.select { |item| item['type'] == 'function_call' }
  return nil if function_calls.empty?

  function_calls.to_h do |fc|
    [
      fc['call_id'],
      ToolCall.new(
        id: fc['call_id'],
        name: fc['name'],
        arguments: parse_arguments(fc['arguments'])
      )
    ]
  end
end

.format_input(messages) ⇒ `Object`

rubocop:disable Metrics/MethodLength

# File 'lib/ruby_llm/providers/openai_responses/chat.rb', line 138

def format_input(messages) # rubocop:disable Metrics/MethodLength
  result = []

  messages.each do |msg|
    if msg.tool_call_id
      # Tool result message - function_call_output type
      result << {
        type: 'function_call_output',
        call_id: msg.tool_call_id,
        output: extract_text_content(msg.content)
      }
    elsif msg.tool_calls&.any?
      # Assistant message with tool calls
      # First add any text content as a message
      text = extract_text_content(msg.content)
      if text && !text.empty?
        result << {
          type: 'message',
          role: 'assistant',
          content: text
        }
      end

      # Then add each function call as a separate item
      msg.tool_calls.each_value do |tc|
        result << {
          type: 'function_call',
          call_id: tc.id,
          name: tc.name,
          arguments: tc.arguments.is_a?(String) ? tc.arguments : JSON.generate(tc.arguments)
        }
      end
    else
      # Regular message
      result << {
        type: 'message',
        role: format_role(msg.role),
        content: format_message_content(msg.content, nil)
      }
    end
  end

  result
end

.format_message_content(content, tool_calls = nil) ⇒ `Object`

# File 'lib/ruby_llm/providers/openai_responses/chat.rb', line 183

def format_message_content(content, tool_calls = nil)
  parts = []

  # Add text content
  text = extract_text_content(content)
  parts << { type: 'input_text', text: text } if text && !text.empty?

  # Add attachments if present
  if content.is_a?(RubyLLM::Content)
    content.attachments.each do |attachment|
      parts << Media.format_attachment(attachment)
    end
  end

  # Add tool calls if present (for assistant messages)
  if tool_calls&.any?
    tool_calls.each_value do |tc|
      parts << {
        type: 'function_call',
        call_id: tc.id,
        name: tc.name,
        arguments: tc.arguments.is_a?(String) ? tc.arguments : JSON.generate(tc.arguments)
      }
    end
  end

  # Return simple text for single text content
  return parts.first[:text] if parts.length == 1 && parts.first[:type] == 'input_text'

  parts
end

.format_role(role) ⇒ `Object`

# File 'lib/ruby_llm/providers/openai_responses/chat.rb', line 228

def format_role(role)
  case role
  when :system then 'developer'
  when :assistant then 'assistant'
  when :tool then 'user' # Tool results come from user perspective
  else role.to_s
  end
end

.parse_arguments(arguments) ⇒ `Object`

# File 'lib/ruby_llm/providers/openai_responses/chat.rb', line 262

def parse_arguments(arguments)
  return {} if arguments.nil? || arguments.empty?
  return arguments if arguments.is_a?(Hash)

  JSON.parse(arguments)
rescue JSON::ParserError
  { raw: arguments }
end

.parse_completion_response(response) ⇒ `Object`

Raises:

(RubyLLM::Error)

# File 'lib/ruby_llm/providers/openai_responses/chat.rb', line 104

def parse_completion_response(response)
  data = response.body
  return if data.nil? || data.empty?

  data = JSON.parse(data) if data.is_a?(String)

  raise RubyLLM::Error.new(response, data.dig('error', 'message')) if data.dig('error', 'message')

  output = data['output'] || []

  # Extract text content from output
  content = extract_output_text(output)

  # Extract tool calls from function_call outputs
  tool_calls = extract_tool_calls(output)

  usage = data['usage'] || {}
  cached_tokens = usage.dig('input_tokens_details', 'cached_tokens')

  Message.new(
    role: :assistant,
    content: content,
    tool_calls: tool_calls,
    input_tokens: usage['input_tokens'],
    output_tokens: usage['output_tokens'],
    cached_tokens: cached_tokens,
    cache_creation_tokens: 0,
    model_id: data['model'],
    response_id: data['id'],
    built_in_tool_events: BuiltInTools.extract_events(output),
    raw: response
  )
end

.render_payload(messages, tools:, temperature:, model:, stream: false, schema: nil, thinking: nil, tool_prefs: nil) ⇒ `Object`

rubocop:disable Metrics/ParameterLists

# File 'lib/ruby_llm/providers/openai_responses/chat.rb', line 16

def render_payload(messages, tools:, temperature:, model:, stream: false,
                   schema: nil, thinking: nil, tool_prefs: nil) # rubocop:disable Lint/UnusedMethodArgument
  tool_prefs ||= {}
  system_messages, non_system_messages = messages.partition { |m| m.role == :system }

  instructions = system_messages.map { |m| extract_text_content(m.content) }.join("\n\n")

  last_response_id = extract_last_response_id(messages)
  input_messages = unchained_messages(non_system_messages, last_response_id)

  payload = {
    model: model.id,
    input: format_input(input_messages),
    stream: stream
  }

  payload[:instructions] = instructions unless instructions.empty?
  payload[:temperature] = temperature unless temperature.nil?
  apply_tools(payload, tools, tool_prefs)
  payload[:text] = build_schema_format(schema) if schema
  payload[:previous_response_id] = last_response_id if last_response_id

  payload
end

.unchained_messages(messages, last_response_id) ⇒ `Object`

When chaining via previous_response_id, the API expects only the new items in ‘input` – the rest already lives in the server-side response chain. Sending the full history every turn appends it to that chain and causes O(N^2) input_tokens growth. See issue #10.

# File 'lib/ruby_llm/providers/openai_responses/chat.rb', line 93

def unchained_messages(messages, last_response_id)
  return messages unless last_response_id

  anchor = messages.rindex do |m|
    m.role == :assistant && m.respond_to?(:response_id) && m.response_id == last_response_id
  end
  return messages unless anchor

  messages[(anchor + 1)..] || []
end

Instance Method Details

#completion_url ⇒ `Object`



9
10
11

# File 'lib/ruby_llm/providers/openai_responses/chat.rb', line 9

def completion_url
  'responses'
end

Module: RubyLLM::Providers::OpenAIResponses::Chat

Overview

Class Method Summary collapse

Instance Method Summary collapse

Class Method Details

.apply_tools(payload, tools, tool_prefs) ⇒ Object

.build_schema_format(schema) ⇒ Object

.build_tool_choice(choice) ⇒ Object

.extract_last_response_id(messages) ⇒ Object

.extract_output_text(output) ⇒ Object

.extract_text_content(content) ⇒ Object

.extract_tool_calls(output) ⇒ Object

.format_input(messages) ⇒ Object

.format_message_content(content, tool_calls = nil) ⇒ Object

.format_role(role) ⇒ Object

.parse_arguments(arguments) ⇒ Object

.parse_completion_response(response) ⇒ Object

.render_payload(messages, tools:, temperature:, model:, stream: false, schema: nil, thinking: nil, tool_prefs: nil) ⇒ Object

.unchained_messages(messages, last_response_id) ⇒ Object