The PaLM API is deprecated for use with Google AI services and tools (but not for Vertex AI). Learn more about this deprecation, its timeline, and how to migrate to use Gemini in the PaLM API deprecation guide.

Esta página foi traduzida pela API Cloud Translation.

Modelos PaLM 2

O PaLM 2 é uma família de modelos de linguagem otimizados para facilidade de uso nos principais casos de uso de desenvolvedores. A família de modelos PaLM inclui variações treinadas para geração de texto e chat, bem como incorporações de texto. Este guia fornece informações sobre cada variação para ajudar você a decidir qual é a melhor para seu caso de uso.

Tamanhos de modelos

Os tamanhos dos modelos são descritos por um nome de animal. A tabela a seguir mostra os tamanhos disponíveis e o que eles significam em relação um ao outro.

Tamanho do modelo	Descrição	Serviços
Bisão	O tamanho do modelo PaLM 2 mais compatível.	texto chat
Lagartixa	O menor e mais eficiente tamanho do modelo PaLM 2.	embeddings

Variações de modelo

Diferentes modelos PaLM estão disponíveis e otimizados para casos de uso específicos. A tabela a seguir descreve os atributos de cada um.

Variedade	Atributo	Descrição
Bison Text (link em inglês)	Última atualização do modelo	Maio de 2023
	Código do modelo	`text-bison-001`
	Recursos do modelo	Entrada: texto Saída: texto Otimizado para tarefas de linguagem, como: Geração de códigos Geração de texto Edição de texto Solução de problemas Geração de recomendações Extração de informações Extração ou geração de dados agente de IA Pode lidar com tarefas zero, one e few-shot.
	Segurança de modelos	Configurações de segurança ajustáveis para seis dimensões de danos disponíveis para desenvolvedores. Consulte o tópico Configurações de segurança para mais detalhes.
	Limite de taxa	90 solicitações por minuto

Bison Chat (em inglês)	Última atualização do modelo	Maio de 2023
	Código do modelo	`chat-bison-001`
	Recursos do modelo	Entrada: texto Saída: texto Gera texto em um formato conversacional. Otimizado para tarefas de linguagem de diálogo, como a implementação de chatbots ou agentes de IA. Pode lidar com tarefas zero, one e few-shot.
	Segurança de modelos	Não há configurações de segurança ajustáveis.
	Limite de taxa	90 solicitações por minuto

Gecko Embedding	Última atualização do modelo	Maio de 2023
	Código do modelo	`embedding-gecko-001`
	Recursos do modelo	Entrada: texto Saída: texto Gera embeddings para o texto de entrada. Otimizado para criar embeddings para texto de até 1.024 tokens.
	Segurança de modelos	Não há configurações de segurança ajustáveis.
	Limite de taxa	1.500 solicitações por minuto

Metadados do modelo

Use a API ModelService para receber mais metadados sobre os modelos mais recentes, como limites de tokens de entrada e saída. A tabela a seguir exibe os metadados da variante de modelo text-bison-001.

Atributo	Valor
Nome de exibição	Bisonte de texto
Código do modelo	`models/text-bison-001`
Descrição	Modelo segmentado para geração de texto
Limite de tokens de entrada	8196
Limite de tokens de saída	1024
Métodos de geração compatíveis	`generateText`
Temperatura	0.7
top_p	0,95
top_k	40

Atributos do modelo

A tabela abaixo descreve os atributos do PaLM 2 que são comuns a todas as variações do modelo.

Atributo	Descrição
Dados de treinamento	O limite de conhecimento do PaLM 2 é meados de 2021. O conhecimento sobre eventos após esse período é limitado.
Idioma suportado	Inglês
Parâmetros de modelo configuráveis	Parte superior Top-k Temperatura Sequência de paradas Comprimento máximo da saída Número de candidatos para as respostas

Consulte a seção Parâmetros do modelo do guia de Introdução aos LLMs para ver informações sobre cada um desses parâmetros.