Modele PaLM 2

PaLM 2 to rodzina modeli językowych zoptymalizowanych pod kątem łatwości użytkowania w kluczowych przypadkach użycia przez programistów. Rodzina modeli PaLM obejmuje odmiany wytrenowane pod kątem generowania tekstu i czatu, a także osadzone teksty. W tym przewodniku znajdziesz informacje o poszczególnych wariantach, które pomogą Ci wybrać tę, która najlepiej sprawdzi się w Twoim przypadku.

Rozmiary modelu

Rozmiary modelu są opisane pod nazwą zwierzęcia. W tabeli poniżej znajdziesz dostępne rozmiary oraz ich znaczenie.

Rozmiar modelu Opis Usługi
Bison Największy rozmiar modelu PaLM 2.
  • plik tekstowy,
  • czat
Gekon Najmniejszy i najbardziej wydajny rozmiar modelu PaLM 2.
  • reprezentacje właściwościowe

Odmiany modelu

Dostępne są różne modele PaLM zoptymalizowane pod kątem konkretnych przypadków użycia. W tabeli poniżej znajdziesz opisy atrybutów każdego z nich.

Różnorodność Atrybut Opis
Tekst Biona Ostatnia aktualizacja modelu Maj 2023 r.
Kod modelu text-bison-001
Możliwości modelu
  • Dane wejściowe: tekst
  • Dane wyjściowe: tekst
  • Zoptymalizowane pod kątem zadań związanych z językiem, takich jak:
    • Generowanie kodu
    • Generowanie tekstu
    • Edytowanie tekstu
    • Rozwiązywanie problemów
    • Generowanie rekomendacji
    • Wyodrębnianie informacji
    • Wyodrębnianie lub generowanie danych
    • Agent AI
  • Może obsłużyć zadania zero, one i few-shot.
Bezpieczeństwo modelu Ustawienia bezpieczeństwa, które można dostosować do naszych 6 wymiarów szkód, które są dostępne dla deweloperów. Więcej informacji znajdziesz w temacie dotyczącym ustawień bezpieczeństwa.
Limit żądań 90 żądań na minutę
Czat Bizon Ostatnia aktualizacja modelu Maj 2023 r.
Kod modelu chat-bison-001
Możliwości modelu
  • Dane wejściowe: tekst
  • Dane wyjściowe: tekst
  • Generuje tekst w formacie konwersacyjnym.
  • Zoptymalizowane pod kątem zadań wykorzystujących język dialogów, takich jak wdrażanie botów na czacie czy agentów AI.
  • Może obsłużyć zadania zero, one i few-shot.
Bezpieczeństwo modelu Brak możliwości dostosowania ustawień bezpieczeństwa.
Limit żądań 90 żądań na minutę
Umieszczanie gekonów Ostatnia aktualizacja modelu Maj 2023 r.
Kod modelu embedding-gecko-001
Możliwości modelu
  • Dane wejściowe: tekst
  • Dane wyjściowe: tekst
  • Generuje wektory dystrybucyjne tekstu wejściowego.
  • Zoptymalizowane do tworzenia wektorów dystrybucyjnych dla tekstu zawierającego maksymalnie 1024 tokeny.
Bezpieczeństwo modelu Brak możliwości dostosowania ustawień bezpieczeństwa.
Limit żądań 1500 żądań na minutę

Metadane modelu

Użyj interfejsu API ModelService, aby uzyskać dodatkowe metadane o najnowszych modelach, takie jak limity tokenów wejściowych i wyjściowych. Tabela poniżej zawiera metadane wariantu modelu text-bison-001.

Atrybut Wartość
Wyświetlana nazwa Wyślij SMS-a – Bisona
Kod modelu models/text-bison-001
Opis Model docelowy na potrzeby generowania tekstu
Limit tokenów wejściowych 8196
Limit tokenów wyjściowych 1024
Obsługiwane metody generowania generateText
Temperatura 0.7
top_p 0,95
top_k 40

Atrybuty modelu

W tabeli poniżej opisujemy atrybuty PaLM 2, które są wspólne dla wszystkich odmian modelu.

Atrybut Opis
Dane treningowe Ostateczny termin składania wniosków przez PaLM 2 to połowa 2021 roku. Informacje o wydarzeniach po tym czasie są ograniczone.
Obsługiwany język angielski
Konfigurowalne parametry modelu
  • Górne P
  • Górne K
  • Temperatura
  • Zatrzymanie sekwencji
  • Maksymalna długość wyjściowa
  • Liczba propozycji odpowiedzi

Informacje o każdym z tych parametrów znajdziesz w sekcji dotyczącej parametrów modelu we przewodniku Wstęp do modeli LLM.