Class: LLM::Gemini::Audio

Inherits:

Object

Object
LLM::Gemini::Audio

show all

Defined in:: lib/llm/providers/gemini/audio.rb

Overview

The LLM::Gemini::Audio class provides an audio object for interacting with Gemini’s audio API.

Examples:

#!/usr/bin/env ruby
require "llm"

llm = LLM.gemini(ENV["KEY"])
res = llm.audio.create_transcription(input: "/audio/rocket.mp3")
res.text # => "A dog on a rocket to the moon"

Instance Method Summary collapse

#initialize(provider) ⇒ LLM::Gemini::Responses constructor
Returns a new Audio object.
#create_speech ⇒ Object
#create_transcription(file:, model: "gemini-1.5-flash", **params) ⇒ LLM::Response::AudioTranscription
Create an audio transcription.
#create_translation(file:, model: "gemini-1.5-flash", **params) ⇒ LLM::Response::AudioTranslation
Create an audio translation (in English).

Constructor Details

#initialize(provider) ⇒ `LLM::Gemini::Responses`

Returns a new Audio object

Parameters:

provider (LLM::Provider)



19
20
21

# File 'lib/llm/providers/gemini/audio.rb', line 19

def initialize(provider)
  @provider = provider
end

Instance Method Details

#create_speech ⇒ `Object`

Raises:

(NotImplementedError) —
This method is not implemented by Gemini



26
27
28

# File 'lib/llm/providers/gemini/audio.rb', line 26

def create_speech
  raise NotImplementedError
end

#create_transcription(file:, model: "gemini-1.5-flash", **params) ⇒ `LLM::Response::AudioTranscription`

Create an audio transcription

Examples:

llm = LLM.gemini(ENV["KEY"])
res = llm.audio.create_transcription(file: "/audio/rocket.mp3")
res.text # => "A dog on a rocket to the moon"

Parameters:

file (String, LLM::File, LLM::Response::File) —
The input audio
model (String) (defaults to: "gemini-1.5-flash") —
The model to use
params (Hash) —
Other parameters (see Gemini docs)

Returns:

(LLM::Response::AudioTranscription)

#create_translation(file:, model: "gemini-1.5-flash", **params) ⇒ `LLM::Response::AudioTranslation`

Create an audio translation (in English)

Examples:

# Arabic => English
llm = LLM.gemini(ENV["KEY"])
res = llm.audio.create_translation(file: "/audio/bismillah.mp3")
res.text # => "In the name of Allah, the Beneficent, the Merciful."

Parameters:

file (String, LLM::File, LLM::Response::File) —
The input audio
model (String) (defaults to: "gemini-1.5-flash") —
The model to use
params (Hash) —
Other parameters (see Gemini docs)

Returns:

(LLM::Response::AudioTranslation)

Class: LLM::Gemini::Audio

Overview

Examples:

Instance Method Summary collapse

Constructor Details

#initialize(provider) ⇒ LLM::Gemini::Responses

Instance Method Details

#create_speech ⇒ Object

#create_transcription(file:, model: "gemini-1.5-flash", **params) ⇒ LLM::Response::AudioTranscription

Examples:

#create_translation(file:, model: "gemini-1.5-flash", **params) ⇒ LLM::Response::AudioTranslation

Examples:

#initialize(provider) ⇒ `LLM::Gemini::Responses`

#create_speech ⇒ `Object`

#create_transcription(file:, model: "gemini-1.5-flash", **params) ⇒ `LLM::Response::AudioTranscription`

#create_translation(file:, model: "gemini-1.5-flash", **params) ⇒ `LLM::Response::AudioTranslation`