Class: GRX::Optim::SGD

Inherits:

Object

Object
GRX::Optim::SGD

show all

Defined in:: lib/grx/optim.rb

Overview

SGD — Stochastic Gradient Descent (con momentum opcional)

Instance Method Summary collapse

#initialize(params, lr: 0.01, momentum: 0.0, weight_decay: 0.0) ⇒ SGD constructor

A new instance of SGD.
#step ⇒ Object
#zero_grad ⇒ Object

Constructor Details

#initialize(params, lr: 0.01, momentum: 0.0, weight_decay: 0.0) ⇒ `SGD`

Returns a new instance of SGD.

# File 'lib/grx/optim.rb', line 9

def initialize(params, lr: 0.01, momentum: 0.0, weight_decay: 0.0)
  @params       = params
  @lr           = lr
  @momentum     = momentum
  @weight_decay = weight_decay
  # Buffer de velocidad para momentum
  @velocity = params.map { |p| Tensor.zeros_like(p) }
end

Instance Method Details

#step ⇒ `Object`

# File 'lib/grx/optim.rb', line 18

def step
  @params.each_with_index do |param, i|
    next unless param.grad

    grad = param.grad

    # L2 regularización (weight decay)
    if @weight_decay > 0
      grad = grad + param.scale(@weight_decay)
    end

    if @momentum > 0
      # v = momentum*v + grad
      @velocity[i] = @velocity[i].scale(@momentum) + grad
      grad = @velocity[i]
    end

    if CAPI::LOADED
      CAPI.grx_sgd_step(param.storage.ptr, grad.storage.ptr, @lr, param.numel)
    else
      # Fallback Ruby
      param_data = param.to_a
      grad_data  = grad.to_a
      param_data.each_with_index { |v, j| param_data[j] = v - @lr * grad_data[j] }
      param.storage.instance_variable_set(:@data, param_data)
    end
  end
end

#zero_grad ⇒ `Object`



47
48
49

# File 'lib/grx/optim.rb', line 47

def zero_grad
  @params.each(&:zero_grad!)
end

Class: GRX::Optim::SGD

Overview

Instance Method Summary collapse

Constructor Details

#initialize(params, lr: 0.01, momentum: 0.0, weight_decay: 0.0) ⇒ SGD

Instance Method Details

#step ⇒ Object

#zero_grad ⇒ Object

#initialize(params, lr: 0.01, momentum: 0.0, weight_decay: 0.0) ⇒ `SGD`

#step ⇒ `Object`

#zero_grad ⇒ `Object`