L'API PaLM è deprecata per l'utilizzo con i servizi e gli strumenti di IA di Google (ma non per Vertex AI). Scopri di più su questo ritiro, sulle relative tempistiche e su come eseguire la migrazione per utilizzare Gemini nella guida al ritiro dell'API PaLM.

Questa pagina è stata tradotta dall'API Cloud Translation.

Modelli PaLM 2

PaLM 2 è una famiglia di modelli linguistici ottimizzati per garantire facilità d'uso nei principali casi d'uso degli sviluppatori. La famiglia di modelli PaLM include varianti addestrati per la generazione di testo e chat, nonché incorporamenti di testo. Questa guida fornisce informazioni su ogni variante per aiutarti a decidere qual è la più adatta al tuo caso d'uso.

Dimensioni dei modelli

Le dimensioni dei modelli sono descritte dal nome di un animale. La seguente tabella mostra le dimensioni disponibili e il loro significato in relazione alle altre.

Dimensione modello	Descrizione	Servizi
Bison	Dimensione del modello PaLM 2 più efficace.	testo chat
Geco	Dimensione del modello PaLM 2 più piccola ed efficiente.	rappresentazioni distribuite

Varianti del modello

Sono disponibili diversi modelli PaLM, ottimizzati per casi d'uso specifici. La tabella seguente descrive gli attributi di ciascuno.

Variazione	Attributo	Descrizione
Testo bisonte	Ultimo aggiornamento del modello	Maggio 2023
	Codice modello	`text-bison-001`
	Capacità del modello	Input: testo Output: testo Ottimizzato per attività relative alle lingue come: Generazione del codice Generazione di testo Modifica del testo Risoluzione dei problemi Generazione di suggerimenti Estrazione di informazioni Estrazione o generazione di dati Agente IA Può gestire attività zero, one e few-shot.
	Sicurezza del modello	Impostazioni di sicurezza regolabili per sei dimensioni del danno a disposizione degli sviluppatori. Per informazioni dettagliate, consulta l'argomento relativo alle impostazioni di sicurezza.
	Limite di frequenza	90 richieste al minuto

Bisonte Chat	Ultimo aggiornamento del modello	Maggio 2023
	Codice modello	`chat-bison-001`
	Capacità del modello	Input: testo Output: testo Genera testo in un formato conversazionale. Ottimizzato per attività in linguaggio di dialogo, come l'implementazione di bot di chat o agenti IA. Può gestire attività zero, one e few-shot.
	Sicurezza del modello	Nessuna impostazione di sicurezza regolabile.
	Limite di frequenza	90 richieste al minuto

Incorporamento Gecko	Ultimo aggiornamento del modello	Maggio 2023
	Codice modello	`embedding-gecko-001`
	Capacità del modello	Input: testo Output: testo Genera incorporamenti di testo per il testo di input. Ottimizzato per la creazione di incorporamenti per testo fino a 1024 token.
	Sicurezza del modello	Nessuna impostazione di sicurezza regolabile.
	Limite di frequenza	1500 richieste al minuto

Metadati del modello

Utilizza l'API ModelService per ottenere metadati aggiuntivi sui modelli più recenti, come i limiti dei token di input e di output. La seguente tabella mostra i metadati per la variante del modello text-bison-001.

Attributo	Valore
Nome visualizzato	Invia un SMS a Bison
Codice modello	`models/text-bison-001`
Descrizione	Modello scelto come target per la generazione di testo
Limite token di input	8196
Limite token di output	1024
Metodi di generazione supportati	`generateText`
Temperatura	0.7
top_p	0,95
top_k	40

Attributi del modello

La tabella seguente descrive gli attributi di PaLM 2, che sono comuni a tutte le varianti del modello.

Attributo	Descrizione
Dati di addestramento	L'orario limite per le conoscenze di PaLM 2 è metà del 2021. Le conoscenze sugli eventi successivi a questo periodo sono limitate.
Lingua supportata	Inglese
Parametri del modello configurabili	Top-p Top-k Temperatura Interrompi sequenza Lunghezza massima dell'output Numero di candidati alla risposta

Per informazioni su ciascuno di questi parametri, consulta la sezione relativa ai parametri del modello nella guida Introduzione agli LLM.