Modèles PaLM 2

PaLM 2 est une famille de modèles de langage, optimisée pour être facile à utiliser dans les principaux cas d'utilisation des développeurs. La famille de modèles PaLM comprend des variantes entraînées pour la génération de texte et de chat, ainsi que des représentations vectorielles continues de texte. Ce guide fournit des informations sur chaque variante pour vous aider à décider celle qui convient le mieux à votre cas d'utilisation.

Tailles de mannequins

Les tailles des mannequins sont décrites par un nom d'animal. Le tableau suivant présente les tailles disponibles et ce qu'elles signifient les unes par rapport aux autres.

Taille du modèle	Description	Services
Bison (bison)	Taille de modèle PaLM 2 la plus performante.	text chat
Gecko (gecko)	Taille de modèle PaLM 2 la plus petite et la plus efficace.	représentations vectorielles continues

Variantes du modèle

Différents modèles de PaLM sont disponibles et optimisés pour des cas d'utilisation spécifiques. Le tableau suivant décrit les attributs de chaque élément.

Variation	Attribut	Description
Texte Bison	Dernière mise à jour du modèle	Mai 2023
	Code du modèle	`text-bison-001`
	Capacités du modèle	Entrée: texte Sortie: text Ce type de cluster est optimisé pour les tâches linguistiques telles que : Génération de code Génération de texte Modification de texte Résolution des problèmes Génération de recommandations Extraction d'informations Extraction ou génération de données Agent IA Peut gérer des tâches "zéro", "un" et "peu de plans".
	Sécurité du modèle	Paramètres de sécurité ajustables pour six dimensions de préjudice disponibles pour les développeurs. Pour plus d'informations, consultez la rubrique Paramètres de sécurité.
	Limite de débit	90 requêtes par minute

Bison Chat	Dernière mise à jour du modèle	Mai 2023
	Code du modèle	`chat-bison-001`
	Capacités du modèle	Entrée: texte Sortie: text Génère du texte dans un format conversationnel. Ce type de cluster est optimisé pour les tâches en langage de dialogue telles que l'implémentation de chatbots ou d'agents d'IA. Peut gérer des tâches "zéro", "un" et "peu de plans".
	Sécurité du modèle	Aucun paramètre de sécurité réglable.
	Limite de débit	90 requêtes par minute

Gecko Embedding	Dernière mise à jour du modèle	Mai 2023
	Code du modèle	`embedding-gecko-001`
	Capacités du modèle	Entrée: texte Sortie: text Génère des représentations vectorielles continues de texte pour le texte d'entrée. Optimisé pour la création de représentations vectorielles continues pour du texte comportant jusqu'à 1 024 jetons.
	Sécurité du modèle	Aucun paramètre de sécurité réglable.
	Limite de débit	1 500 requêtes par minute

Métadonnées du modèle

Utilisez l'API ModelService pour obtenir des métadonnées supplémentaires sur les derniers modèles, telles que les limites des jetons d'entrée et de sortie. Le tableau suivant affiche les métadonnées de la variante de modèle text-bison-001.

Attribut	Valeur
Nom à afficher	Texte Bison
Code du modèle	`models/text-bison-001`
Description	Modèle ciblé pour la génération de texte
Limite de jetons d'entrée	8196
Limite de jetons de sortie	1024
Méthodes de génération compatibles	`generateText`
Température	0.7
top_p	0,95
top_k	40

Attributs du modèle

Le tableau ci-dessous décrit les attributs du PaLM 2 communs à toutes les variantes du modèle.

Attribut	Description
Données d'entraînement	L'heure limite pour connaître PaLM 2 est mi-2021. Les connaissances sur les événements postérieurs à cette date sont limitées.
Niveau de langage accepté	Anglais
Paramètres de modèle configurables	Top P Top k Température Arrêter la séquence Longueur maximale de la sortie Nombre de réponses candidates

Consultez la section Paramètres du modèle du guide d'introduction aux LLM pour en savoir plus sur chacun de ces paramètres.