Modelli PaLM 2

PaLM 2 è una famiglia di modelli linguistici ottimizzati per garantire facilità d'uso nei principali casi d'uso degli sviluppatori. La famiglia di modelli PaLM include varianti addestrati per la generazione di testo e chat, nonché incorporamenti di testo. Questa guida fornisce informazioni su ogni variante per aiutarti a decidere qual è la più adatta al tuo caso d'uso.

Dimensioni dei modelli

Le dimensioni dei modelli sono descritte dal nome di un animale. La seguente tabella mostra le dimensioni disponibili e il loro significato in relazione alle altre.

Dimensione modello Descrizione Servizi
Bison Dimensione del modello PaLM 2 più efficace.
  • testo
  • chat
Geco Dimensione del modello PaLM 2 più piccola ed efficiente.
  • rappresentazioni distribuite

Varianti del modello

Sono disponibili diversi modelli PaLM, ottimizzati per casi d'uso specifici. La tabella seguente descrive gli attributi di ciascuno.

Variazione Attributo Descrizione
Testo bisonte Ultimo aggiornamento del modello Maggio 2023
Codice modello text-bison-001
Capacità del modello
  • Input: testo
  • Output: testo
  • Ottimizzato per attività relative alle lingue come:
    • Generazione del codice
    • Generazione di testo
    • Modifica del testo
    • Risoluzione dei problemi
    • Generazione di suggerimenti
    • Estrazione di informazioni
    • Estrazione o generazione di dati
    • Agente IA
  • Può gestire attività zero, one e few-shot.
Sicurezza del modello Impostazioni di sicurezza regolabili per sei dimensioni del danno a disposizione degli sviluppatori. Per informazioni dettagliate, consulta l'argomento relativo alle impostazioni di sicurezza.
Limite di frequenza 90 richieste al minuto
Bisonte Chat Ultimo aggiornamento del modello Maggio 2023
Codice modello chat-bison-001
Capacità del modello
  • Input: testo
  • Output: testo
  • Genera testo in un formato conversazionale.
  • Ottimizzato per attività in linguaggio di dialogo, come l'implementazione di bot di chat o agenti IA.
  • Può gestire attività zero, one e few-shot.
Sicurezza del modello Nessuna impostazione di sicurezza regolabile.
Limite di frequenza 90 richieste al minuto
Incorporamento Gecko Ultimo aggiornamento del modello Maggio 2023
Codice modello embedding-gecko-001
Capacità del modello
  • Input: testo
  • Output: testo
  • Genera incorporamenti di testo per il testo di input.
  • Ottimizzato per la creazione di incorporamenti per testo fino a 1024 token.
Sicurezza del modello Nessuna impostazione di sicurezza regolabile.
Limite di frequenza 1500 richieste al minuto

Metadati del modello

Utilizza l'API ModelService per ottenere metadati aggiuntivi sui modelli più recenti, come i limiti dei token di input e di output. La seguente tabella mostra i metadati per la variante del modello text-bison-001.

Attributo Valore
Nome visualizzato Invia un SMS a Bison
Codice modello models/text-bison-001
Descrizione Modello scelto come target per la generazione di testo
Limite token di input 8196
Limite token di output 1024
Metodi di generazione supportati generateText
Temperatura 0.7
top_p 0,95
top_k 40

Attributi del modello

La tabella seguente descrive gli attributi di PaLM 2, che sono comuni a tutte le varianti del modello.

Attributo Descrizione
Dati di addestramento L'orario limite per le conoscenze di PaLM 2 è metà del 2021. Le conoscenze sugli eventi successivi a questo periodo sono limitate.
Lingua supportata Inglese
Parametri del modello configurabili
  • Top-p
  • Top-k
  • Temperatura
  • Interrompi sequenza
  • Lunghezza massima dell'output
  • Numero di candidati alla risposta

Per informazioni su ciascuno di questi parametri, consulta la sezione relativa ai parametri del modello nella guida Introduzione agli LLM.