Modelos de PaLM 2

PaLM 2 es una familia de modelos de lenguaje optimizados para facilitar su uso en casos de uso clave de desarrolladores. La familia de modelos de PaLM incluye variaciones entrenadas para la generación de texto y chat, así como incorporaciones de texto. En esta guía, se proporciona información sobre cada variación para ayudarte a decidir cuál es la mejor opción para tu caso de uso.

Tamaños del modelo

Los tamaños del modelo se describen con el nombre de un animal. En la siguiente tabla, se muestran los tamaños disponibles y su significado en relación con los demás.

Tamaño del modelo Descripción Servicios
Bisonte Tamaño del modelo PaLM 2 más capaz
  • text
  • chat
Geco El tamaño del modelo PaLM 2 más pequeño y eficiente.
  • incorporaciones

Variaciones del modelo

Hay distintos modelos de PaLM disponibles y optimizados para casos de uso específicos. En la siguiente tabla, se describen los atributos de cada uno.

Variedad Atributo Descripción
Texto de bisonte Última actualización del modelo Mayo de 2023
Código del modelo text-bison-001
Capacidades del modelo
  • Entrada: texto
  • Resultado: texto
  • Optimizado para tareas de lenguaje como las siguientes:
    • Generación de código
    • Generación de texto
    • Edición de texto
    • Solución de problemas
    • Generación de recomendaciones
    • Extracción de información
    • Extracción o generación de datos
    • Agente de IA
  • Puede controlar tareas con cero, un solo ejemplo y con ejemplos limitados.
Seguridad del modelo Configuración de seguridad ajustable para 6 dimensiones de daño disponible para los desarrolladores. Consulta el tema sobre configuración de seguridad para obtener más detalles.
Límite de frecuencia 90 solicitudes por minuto
Bison Chat Última actualización del modelo Mayo de 2023
Código del modelo chat-bison-001
Capacidades del modelo
  • Entrada: texto
  • Resultado: texto
  • Genera texto en un formato conversacional.
  • Optimizada para tareas de lenguaje de diálogo, como la implementación de chat bots o agentes de IA.
  • Puede controlar tareas con cero, un solo ejemplo y con ejemplos limitados.
Seguridad del modelo No hay parámetros de configuración de seguridad ajustables.
Límite de frecuencia 90 solicitudes por minuto
Gecko Embedding Última actualización del modelo Mayo de 2023
Código del modelo embedding-gecko-001
Capacidades del modelo
  • Entrada: texto
  • Resultado: texto
  • Genera incorporaciones de texto para el texto de entrada.
  • Optimizado para crear incorporaciones de texto de hasta 1,024 tokens.
Seguridad del modelo No hay parámetros de configuración de seguridad ajustables.
Límite de frecuencia 1,500 solicitudes por minuto

Metadatos del modelo

Usa la API de ModelService para obtener metadatos adicionales sobre los modelos más recientes, como los límites de tokens de entrada y salida. En la siguiente tabla, se muestran los metadatos de la variante del modelo text-bison-001.

Atributo Valor
Nombre visible Bisonte de texto
Código del modelo models/text-bison-001
Descripción Modelo orientado a la generación de texto
Límite de tokens de entrada 8196
Límite de tokens de salida 1024
Métodos de generación compatibles generateText
Temperatura 0.7
top_p 0.95
top_k 40

Atributos del modelo

En la siguiente tabla, se describen los atributos de PaLM 2 que son comunes a todas las variaciones del modelo.

Atributo Descripción
Datos de entrenamiento El horario límite para hacer conocimiento de PaLM 2 es mediados de 2021. El conocimiento sobre los eventos después de ese tiempo es limitado.
Idioma admitido Inglés
Parámetros de modelo configurables
  • P superior
  • K superior
  • Temperatura
  • Secuencia de detención
  • Longitud máxima de salida
  • Cantidad de candidatos de respuesta

Consulta la sección Parámetros del modelo de la guía Introducción a los LLM para obtener información sobre cada uno de estos parámetros.