Class: SignalWire::Skills::Builtin::SpiderSkill

Inherits:

SkillBase

Object
SkillBase
SignalWire::Skills::Builtin::SpiderSkill

show all

Defined in:: lib/signalwire/skills/builtin/spider.rb

Instance Attribute Summary

Attributes inherited from SkillBase

#agent, #logger, #params, #swaig_fields

Instance Method Summary collapse

#description ⇒ Object
#get_hints ⇒ Object
#get_parameter_schema ⇒ Object
#instance_key ⇒ Object
#name ⇒ Object
#register_tools ⇒ Object
#setup ⇒ Object
#supports_multiple_instances? ⇒ Boolean

Methods inherited from SkillBase

#cleanup, #get_global_data, #get_param, #get_prompt_sections, #initialize, #required_env_vars, #version

Constructor Details

This class inherits a constructor from SignalWire::Skills::SkillBase

Instance Method Details

#description ⇒ `Object`

14	# File 'lib/signalwire/skills/builtin/spider.rb', line 14 def description; 'Fast web scraping and crawling capabilities'; end

#get_hints ⇒ `Object`



53
54
55

# File 'lib/signalwire/skills/builtin/spider.rb', line 53

def get_hints
  %w[scrape crawl extract web\ page website spider]
end

#get_parameter_schema ⇒ `Object`

# File 'lib/signalwire/skills/builtin/spider.rb', line 57

def get_parameter_schema
  {
    'timeout'         => { 'type' => 'integer', 'default' => 5 },
    'max_text_length' => { 'type' => 'integer', 'default' => 10_000 },
    'user_agent'      => { 'type' => 'string' }
  }
end

#instance_key ⇒ `Object`



26
27
28

# File 'lib/signalwire/skills/builtin/spider.rb', line 26

def instance_key
  "spider_#{get_param('tool_name', default: 'spider')}"
end

#name ⇒ `Object`

13	# File 'lib/signalwire/skills/builtin/spider.rb', line 13 def name; 'spider'; end

#register_tools ⇒ `Object`

# File 'lib/signalwire/skills/builtin/spider.rb', line 30

def register_tools
  [
    {
      name: "#{@tool_prefix}scrape_url",
      description: 'Extract text content from a single web page',
      parameters: { 'url' => { 'type' => 'string', 'description' => 'The URL to scrape' } },
      handler: method(:handle_scrape)
    },
    {
      name: "#{@tool_prefix}crawl_site",
      description: 'Crawl multiple pages starting from a URL',
      parameters: { 'start_url' => { 'type' => 'string', 'description' => 'Starting URL for the crawl' } },
      handler: method(:handle_crawl)
    },
    {
      name: "#{@tool_prefix}extract_structured_data",
      description: 'Extract specific data from a web page using selectors',
      parameters: { 'url' => { 'type' => 'string', 'description' => 'The URL to scrape' } },
      handler: method(:handle_extract)
    }
  ]
end

#setup ⇒ `Object`

# File 'lib/signalwire/skills/builtin/spider.rb', line 17

def setup
  @max_text_length = (get_param('max_text_length', default: 10_000)).to_i
  @timeout         = (get_param('timeout', default: 5)).to_i
  @user_agent      = get_param('user_agent', default: 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36')
  @tool_prefix     = get_param('tool_name', default: '')
  @tool_prefix     = "#{@tool_prefix}_" unless @tool_prefix.empty?
  true
end

#supports_multiple_instances? ⇒ `Boolean`

Returns:

(Boolean)

15	# File 'lib/signalwire/skills/builtin/spider.rb', line 15 def supports_multiple_instances?; true; end

Class: SignalWire::Skills::Builtin::SpiderSkill

Instance Attribute Summary

Attributes inherited from SkillBase

Instance Method Summary collapse

Methods inherited from SkillBase

Constructor Details

Instance Method Details

#description ⇒ Object

#get_hints ⇒ Object

#get_parameter_schema ⇒ Object

#instance_key ⇒ Object

#name ⇒ Object

#register_tools ⇒ Object

#setup ⇒ Object

#supports_multiple_instances? ⇒ Boolean

#description ⇒ `Object`

#get_hints ⇒ `Object`

#get_parameter_schema ⇒ `Object`

#instance_key ⇒ `Object`

#name ⇒ `Object`

#register_tools ⇒ `Object`

#setup ⇒ `Object`

#supports_multiple_instances? ⇒ `Boolean`