PaLM 2-Modelle

PaLM 2 ist eine Familie von Sprachmodellen, die für die einfache Verwendung bei wichtigen Entwickleranwendungsfällen optimiert sind. Die PaLM-Modellfamilie enthält Varianten, die für die Text- und Chatgenerierung sowie für Texteinbettungen trainiert wurden. Dieser Leitfaden enthält Informationen zu jeder Variante, damit Sie entscheiden können, welche für Ihren Anwendungsfall am besten geeignet ist.

Modellgrößen

Die Modellgrößen werden durch den Namen eines Tiers beschrieben. In der folgenden Tabelle sehen Sie die verfügbaren Größen und ihre Bedeutung im Verhältnis zueinander.

Modellgröße Beschreibung Dienste
Bison Leistungsstärkste PaLM 2-Modellgröße.
  • Text
  • chat
Gecko Kleinste und effizienteste PaLM 2-Modellgröße.
  • Einbettungen

Modellvarianten

Für bestimmte Anwendungsfälle sind verschiedene PaLM-Modelle verfügbar und optimiert. In der folgenden Tabelle werden die jeweiligen Attribute beschrieben.

Variation Attribut Beschreibung
Bison-Text Letzte Aktualisierung des Modells Mai 2023
Modellcode text-bison-001
Modellfunktionen
  • Eingabe: Text
  • Ausgabe: Text
  • Optimiert für Sprachaufgaben wie:
    • Codegenerierung
    • Textgenerierung
    • Textbearbeitung
    • Probleme lösen
    • Empfehlungsgenerierung
    • Informationsextraktion
    • Datenextraktion oder -generierung
    • KI-Agent
  • Kann null, eine und wenige Aufgaben erledigen.
Modellsicherheit Anpassbare Sicherheitseinstellungen für 6 Dimensionen von Schäden für Entwickler verfügbar. Weitere Informationen finden Sie unter Sicherheitseinstellungen.
Ratenbegrenzung 90 Anfragen pro Minute
Bison – Chat Letzte Aktualisierung des Modells Mai 2023
Modellcode chat-bison-001
Modellfunktionen
  • Eingabe: Text
  • Ausgabe: Text
  • Generiert Text in einem dialogorientierten Format.
  • Optimiert für Aufgaben der Dialogsprache wie die Implementierung von Chatbots oder KI-Agents.
  • Kann null, eine und wenige Aufgaben erledigen.
Modellsicherheit Keine anpassbaren Sicherheitseinstellungen.
Ratenbegrenzung 90 Anfragen pro Minute
Geckoeinbettung Letzte Aktualisierung des Modells Mai 2023
Modellcode embedding-gecko-001
Modellfunktionen
  • Eingabe: Text
  • Ausgabe: Text
  • Erzeugt Texteinbettungen für den Eingabetext.
  • Optimiert für das Erstellen von Einbettungen für Text mit bis zu 1.024 Tokens.
Modellsicherheit Keine anpassbaren Sicherheitseinstellungen.
Ratenbegrenzung 1.500 Anfragen pro Minute

Modellmetadaten

Mit der ModelService API können Sie zusätzliche Metadaten zu den neuesten Modellen abrufen, z. B. Limits für Eingabe- und Ausgabetokens. In der folgenden Tabelle sind die Metadaten für die Modellvariante text-bison-001 aufgeführt.

Attribut Wert
Anzeigename SMS-Bison
Modellcode models/text-bison-001
Beschreibung Modell, auf das Textgenerierung ausgerichtet ist
Limit für Eingabetoken 8196
Limit für Ausgabetokens 1024
Unterstützte Generierungsmethoden generateText
Temperatur 0.7
top_p 0,95
top_k 40

Modellattribute

In der folgenden Tabelle werden die Attribute der PaLM 2 beschrieben, die allen Modellvarianten gemeinsam sind.

Attribut Beschreibung
Trainingsdaten Für PaLM 2 ist Mitte 2021 der Stichtag für die Wissensvermittlung. Das Wissen über Ereignisse, die nach diesem Zeitraum stattfinden, ist begrenzt.
Unterstützte Sprachen Englisch
Konfigurierbare Modellparameter
  • Top P
  • Top K
  • Temperatur
  • Sequenz beenden
  • Maximale Ausgabelänge
  • Anzahl der Antwortkandidaten

Informationen zu den einzelnen Parametern finden Sie im Abschnitt Modellparameter des Leitfadens „Einführung in LLMs“.