ПалМ 2 модели

PaLM 2 — это семейство языковых моделей, оптимизированных для простоты использования в ключевых сценариях использования разработчиками. Семейство моделей PaLM включает варианты, предназначенные для генерации текста и чатов, а также для встраивания текста. В этом руководстве представлена ​​информация о каждом варианте, которая поможет вам решить, какой вариант лучше всего подходит для вашего случая использования.

Размеры модели

Размеры модели описаны по имени животного. В следующей таблице показаны доступные размеры и их значение по отношению друг к другу.

Размер модели Описание Услуги
Бизон Самый производительный размер модели PaLM 2.
  • текст
  • чат
Геккон Самый маленький и самый эффективный размер модели PaLM 2.
  • вложения

Варианты модели

Доступны различные модели PaLM, оптимизированные для конкретных случаев использования. В следующей таблице описаны атрибуты каждого из них.

Вариация Атрибут Описание
Текст Бизона Последнее обновление модели май 2023 г.
Код модели text-bison-001
Возможности модели
  • Ввод: текст
  • Выход: текст
  • Оптимизирован для таких языковых задач, как:
    • Генерация кода
    • Генерация текста
    • Редактирование текста
    • Решение проблем
    • Генерация рекомендаций
    • Извлечение информации
    • Извлечение или генерация данных
    • ИИ-агент
  • Может решать задачи с нулевым, одним и несколькими действиями.
Безопасность модели Разработчикам доступны регулируемые настройки безопасности по 6 измерениям вреда. Подробности смотрите в разделе «Настройки безопасности» .
Ограничение скорости 90 запросов в минуту
Бизон-чат Последнее обновление модели май 2023 г.
Код модели chat-bison-001
Возможности модели
  • Ввод: текст
  • Выход: текст
  • Генерирует текст в диалоговом формате.
  • Оптимизирован для задач языка диалога, таких как внедрение чат-ботов или агентов искусственного интеллекта.
  • Может решать задачи с нулевым, одним и несколькими действиями.
Безопасность модели Нет регулируемых настроек безопасности.
Ограничение скорости 90 запросов в минуту
Встраивание гекконов Последнее обновление модели май 2023 г.
Код модели embedding-gecko-001
Возможности модели
  • Ввод: текст
  • Выход: текст
  • Создает вложения текста для входного текста.
  • Оптимизирован для создания вложений текста длиной до 1024 токенов.
Безопасность модели Нет регулируемых настроек безопасности.
Ограничение скорости 1500 запросов в минуту

Метаданные модели

Используйте API ModelService , чтобы получить дополнительные метаданные о последних моделях, например ограничения входных и выходных токенов. В следующей таблице показаны метаданные для варианта модели text-bison-001 .

Атрибут Ценить
Отображаемое имя Текст Бизон
Код модели models/text-bison-001
Описание Модель, предназначенная для генерации текста
Лимит входных токенов 8196
Лимит выходных токенов 1024
Поддерживаемые методы генерации generateText
Температура 0,7
top_p 0,95
top_k 40

Атрибуты модели

В таблице ниже описаны атрибуты PaLM 2, общие для всех вариантов модели.

Атрибут Описание
Данные обучения Срок прекращения знаний PaLM 2 — середина 2021 года. Знания о событиях после этого времени ограничены.
Поддерживаемый язык Английский
Настраиваемые параметры модели
  • Топ р
  • Топ к
  • Температура
  • Остановить последовательность
  • Максимальная длина вывода
  • Количество кандидатов на ответ

Информацию о каждом из этих параметров см. в разделе «Параметры модели» руководства «Введение в LLM».