Model PaLM 2

PaLM 2 adalah kelompok model bahasa, yang dioptimalkan untuk kemudahan penggunaan pada kasus penggunaan developer utama. Kelompok model PaLM mencakup variasi yang dilatih untuk pembuatan teks dan chat, serta embedding teks. Panduan ini memberikan informasi tentang setiap variasi untuk membantu Anda memutuskan variasi yang paling cocok untuk kasus penggunaan Anda.

Ukuran model

Ukuran model dijelaskan dengan nama hewan. Tabel berikut menunjukkan ukuran yang tersedia dan artinya jika dibandingkan satu sama lain.

Ukuran model Deskripsi Layanan
Bison Ukuran model PaLM 2 yang paling kompatibel.
  • teks
  • chat
Tokek Ukuran model PaLM 2 terkecil dan paling efisien.
  • embedding

Variasi model

Berbagai model PaLM tersedia dan dioptimalkan untuk kasus penggunaan tertentu. Tabel berikut menjelaskan atribut dari setiap atribut.

Variasi Atribut Deskripsi
Teks Bison Model terakhir diperbarui Mei 2023
Kode model text-bison-001
Kemampuan model
  • Masukan: teks
  • Output: teks
  • Dioptimalkan untuk tugas bahasa seperti:
    • Pembuatan kode
    • Pembuatan teks
    • Pengeditan teks
    • Pemecahan masalah
    • Pembuatan rekomendasi
    • Ekstraksi informasi
    • Ekstraksi atau pembuatan data
    • Agen AI
  • Dapat menangani tugas zero, one, dan few-shot.
Keamanan model Setelan keamanan yang dapat disesuaikan untuk 6 dimensi bahaya yang tersedia bagi developer. Lihat topik setelan keamanan untuk mengetahui detailnya.
Batas kapasitas 90 permintaan per menit
Chat Bison Model terakhir diperbarui Mei 2023
Kode model chat-bison-001
Kemampuan model
  • Masukan: teks
  • Output: teks
  • Menghasilkan teks dalam format percakapan.
  • Dioptimalkan untuk tugas bahasa dialog seperti implementasi bot chat atau agen AI.
  • Dapat menangani tugas zero, one, dan few-shot.
Keamanan model Tidak ada setelan keamanan yang dapat disesuaikan.
Batas kapasitas 90 permintaan per menit
Penyematan Tokek Model terakhir diperbarui Mei 2023
Kode model embedding-gecko-001
Kemampuan model
  • Masukan: teks
  • Output: teks
  • Menghasilkan embedding teks untuk teks input.
  • Dioptimalkan untuk membuat embeddings untuk teks hingga 1024 token.
Keamanan model Tidak ada setelan keamanan yang dapat disesuaikan.
Batas kapasitas 1.500 permintaan per menit

Metadata model

Gunakan ModelService API untuk mendapatkan metadata tambahan tentang model terbaru seperti batas token input dan output. Tabel berikut menampilkan metadata untuk varian model text-bison-001.

Atribut Nilai
Nama tampilan Kirim Pesan Bison
Kode model models/text-bison-001
Deskripsi Model yang ditargetkan untuk pembuatan teks
Batas token input 8196
Batas token output 1024
Metode pembuatan yang didukung generateText
Suhu 0.7
top_p 0,95
top_k 40

Atribut model

Tabel di bawah ini menjelaskan atribut PaLM 2 yang umum untuk semua variasi model.

Atribut Deskripsi
Data pelatihan Batas waktu pengetahuan PaLM 2 adalah pertengahan tahun 2021. Pengetahuan tentang peristiwa setelah waktu tersebut terbatas.
Bahasa yang didukung Inggris
Parameter model yang dapat dikonfigurasi
  • p teratas
  • K teratas
  • Suhu
  • Hentikan urutan
  • Panjang output maksimum
  • Jumlah kandidat respons

Lihat bagian parameter model dalam panduan Pengantar LLM untuk mengetahui informasi tentang setiap parameter ini.