Modèles PaLM 2

PaLM 2 est une famille de modèles de langage, optimisée pour être facile à utiliser dans les principaux cas d'utilisation des développeurs. La famille de modèles PaLM comprend des variantes entraînées pour la génération de texte et de chat, ainsi que des représentations vectorielles continues de texte. Ce guide fournit des informations sur chaque variante pour vous aider à décider celle qui convient le mieux à votre cas d'utilisation.

Tailles de mannequins

Les tailles des mannequins sont décrites par un nom d'animal. Le tableau suivant présente les tailles disponibles et ce qu'elles signifient les unes par rapport aux autres.

Taille du modèle Description Services
Bison (bison) Taille de modèle PaLM 2 la plus performante.
  • text
  • chat
Gecko (gecko) Taille de modèle PaLM 2 la plus petite et la plus efficace.
  • représentations vectorielles continues

Variantes du modèle

Différents modèles de PaLM sont disponibles et optimisés pour des cas d'utilisation spécifiques. Le tableau suivant décrit les attributs de chaque élément.

Variation Attribut Description
Texte Bison Dernière mise à jour du modèle Mai 2023
Code du modèle text-bison-001
Capacités du modèle
  • Entrée: texte
  • Sortie: text
  • Ce type de cluster est optimisé pour les tâches linguistiques telles que :
    • Génération de code
    • Génération de texte
    • Modification de texte
    • Résolution des problèmes
    • Génération de recommandations
    • Extraction d'informations
    • Extraction ou génération de données
    • Agent IA
  • Peut gérer des tâches "zéro", "un" et "peu de plans".
Sécurité du modèle Paramètres de sécurité ajustables pour six dimensions de préjudice disponibles pour les développeurs. Pour plus d'informations, consultez la rubrique Paramètres de sécurité.
Limite de débit 90 requêtes par minute
Bison Chat Dernière mise à jour du modèle Mai 2023
Code du modèle chat-bison-001
Capacités du modèle
  • Entrée: texte
  • Sortie: text
  • Génère du texte dans un format conversationnel.
  • Ce type de cluster est optimisé pour les tâches en langage de dialogue telles que l'implémentation de chatbots ou d'agents d'IA.
  • Peut gérer des tâches "zéro", "un" et "peu de plans".
Sécurité du modèle Aucun paramètre de sécurité réglable.
Limite de débit 90 requêtes par minute
Gecko Embedding Dernière mise à jour du modèle Mai 2023
Code du modèle embedding-gecko-001
Capacités du modèle
  • Entrée: texte
  • Sortie: text
  • Génère des représentations vectorielles continues de texte pour le texte d'entrée.
  • Optimisé pour la création de représentations vectorielles continues pour du texte comportant jusqu'à 1 024 jetons.
Sécurité du modèle Aucun paramètre de sécurité réglable.
Limite de débit 1 500 requêtes par minute

Métadonnées du modèle

Utilisez l'API ModelService pour obtenir des métadonnées supplémentaires sur les derniers modèles, telles que les limites des jetons d'entrée et de sortie. Le tableau suivant affiche les métadonnées de la variante de modèle text-bison-001.

Attribut Valeur
Nom à afficher Texte Bison
Code du modèle models/text-bison-001
Description Modèle ciblé pour la génération de texte
Limite de jetons d'entrée 8196
Limite de jetons de sortie 1024
Méthodes de génération compatibles generateText
Température 0.7
top_p 0,95
top_k 40

Attributs du modèle

Le tableau ci-dessous décrit les attributs du PaLM 2 communs à toutes les variantes du modèle.

Attribut Description
Données d'entraînement L'heure limite pour connaître PaLM 2 est mi-2021. Les connaissances sur les événements postérieurs à cette date sont limitées.
Niveau de langage accepté Anglais
Paramètres de modèle configurables
  • Top P
  • Top k
  • Température
  • Arrêter la séquence
  • Longueur maximale de la sortie
  • Nombre de réponses candidates

Consultez la section Paramètres du modèle du guide d'introduction aux LLM pour en savoir plus sur chacun de ces paramètres.