Modelos PaLM 2

O PaLM 2 é uma família de modelos de linguagem otimizados para facilidade de uso nos principais casos de uso de desenvolvedores. A família de modelos PaLM inclui variações treinadas para geração de texto e chat, bem como incorporações de texto. Este guia fornece informações sobre cada variação para ajudar você a decidir qual é a melhor para seu caso de uso.

Tamanhos de modelos

Os tamanhos dos modelos são descritos por um nome de animal. A tabela a seguir mostra os tamanhos disponíveis e o que eles significam em relação um ao outro.

Tamanho do modelo Descrição Serviços
Bisão O tamanho do modelo PaLM 2 mais compatível.
  • texto
  • chat
Lagartixa O menor e mais eficiente tamanho do modelo PaLM 2.
  • embeddings

Variações de modelo

Diferentes modelos PaLM estão disponíveis e otimizados para casos de uso específicos. A tabela a seguir descreve os atributos de cada um.

Variedade Atributo Descrição
Bison Text (link em inglês) Última atualização do modelo Maio de 2023
Código do modelo text-bison-001
Recursos do modelo
  • Entrada: texto
  • Saída: texto
  • Otimizado para tarefas de linguagem, como:
    • Geração de códigos
    • Geração de texto
    • Edição de texto
    • Solução de problemas
    • Geração de recomendações
    • Extração de informações
    • Extração ou geração de dados
    • agente de IA
  • Pode lidar com tarefas zero, one e few-shot.
Segurança de modelos Configurações de segurança ajustáveis para seis dimensões de danos disponíveis para desenvolvedores. Consulte o tópico Configurações de segurança para mais detalhes.
Limite de taxa 90 solicitações por minuto
Bison Chat (em inglês) Última atualização do modelo Maio de 2023
Código do modelo chat-bison-001
Recursos do modelo
  • Entrada: texto
  • Saída: texto
  • Gera texto em um formato conversacional.
  • Otimizado para tarefas de linguagem de diálogo, como a implementação de chatbots ou agentes de IA.
  • Pode lidar com tarefas zero, one e few-shot.
Segurança de modelos Não há configurações de segurança ajustáveis.
Limite de taxa 90 solicitações por minuto
Gecko Embedding Última atualização do modelo Maio de 2023
Código do modelo embedding-gecko-001
Recursos do modelo
  • Entrada: texto
  • Saída: texto
  • Gera embeddings para o texto de entrada.
  • Otimizado para criar embeddings para texto de até 1.024 tokens.
Segurança de modelos Não há configurações de segurança ajustáveis.
Limite de taxa 1.500 solicitações por minuto

Metadados do modelo

Use a API ModelService para receber mais metadados sobre os modelos mais recentes, como limites de tokens de entrada e saída. A tabela a seguir exibe os metadados da variante de modelo text-bison-001.

Atributo Valor
Nome de exibição Bisonte de texto
Código do modelo models/text-bison-001
Descrição Modelo segmentado para geração de texto
Limite de tokens de entrada 8196
Limite de tokens de saída 1024
Métodos de geração compatíveis generateText
Temperatura 0.7
top_p 0,95
top_k 40

Atributos do modelo

A tabela abaixo descreve os atributos do PaLM 2 que são comuns a todas as variações do modelo.

Atributo Descrição
Dados de treinamento O limite de conhecimento do PaLM 2 é meados de 2021. O conhecimento sobre eventos após esse período é limitado.
Idioma suportado Inglês
Parâmetros de modelo configuráveis
  • Parte superior
  • Top-k
  • Temperatura
  • Sequência de paradas
  • Comprimento máximo da saída
  • Número de candidatos para as respostas

Consulte a seção Parâmetros do modelo do guia de Introdução aos LLMs para ver informações sobre cada um desses parâmetros.