Google выпускает открытые модели Gemma

Компания Google выпустила набор легких открытых моделей, созданных на основе тех же исследований и технологий, которые использовались при создании недавних моделей Google Gemini.

Модели Gemma - это большие языковые модели, работающие только с декодером, доступные на английском языке, с открытыми весами, предварительно обученными вариантами и вариантами, настраиваемыми по инструкции.

Команда Gemma утверждает, что ее модели имеют общие технические и инфраструктурные компоненты с Gemini, что позволяет представленным моделям двух размеров - Gemma 2B и 7B - показывать хорошие результаты для своих размеров по сравнению с другими открытыми моделями. Модели Gemma могут работать непосредственно на ноутбуке или настольном компьютере разработчика.

По словам команды Gemma, модели разных размеров выпускаются с предварительно обученными и настроенными по инструкции вариантами. Релиз сопровождается новым набором инструментов ответственного генеративного ИИ, который содержит руководство и основные инструменты для создания безопасных приложений ИИ с помощью Gemma. Инструментарий содержит ресурсы для применения лучших практик ответственного использования открытых моделей, включая руководство по настройке политик безопасности, настройке безопасности, классификаторам безопасности и оценке моделей. В нем также есть инструмент под названием Learning Interpretability Tool (LIT), который можно использовать для изучения поведения Gemma и решения любых потенциальных проблем.

Google также предоставляет инструментальные цепочки для выводов и контролируемой тонкой настройки (SFT) в таких фреймворках, как JAX, PyTorch и TensorFlow, через встроенный Keras 3.0. Имеются готовые к использованию блокноты Colab и Kaggle, а программное обеспечение интегрировано с такими инструментами, как Hugging Face, MaxText, NVIDIA NeMo и TensorRT-LLM.

По словам Google, Gemma оптимизирована для нескольких аппаратных платформ ИИ, включая NVIDIA GPU и Google Cloud TPU. Облачная оптимизация осуществляется с помощью Vertex AI, который, по словам Google, предоставляет широкий набор инструментов MLOps с различными вариантами настройки и развертыванием в один клик с использованием встроенных оптимизаций вывода. Расширенная настройка доступна как с помощью полностью управляемых инструментов Vertex AI, так и с помощью самоуправляемого GKE.

Помимо Google Gemma, несколько версий моделей доступны на GitHub. Это официальная реализация моделей на Pytorch; легкий, автономный движок для выводов на C++ для базовых моделей Gemma; реализация выводов и примеры на основе Flax и JAX.

Google Gemma доступна уже сейчас.

Google выпускает открытые модели Gemma
Понравилась новость? Тогда не забудь оставить свой комментарий.
А так же, добавь наш сайт в закладки (нажми Ctrl+D), не теряй нас.
29 февраля 2024 г.
42
Теги: Google , Gemma

Комментарии

Оставить комментарий:
* отправляя форму, я даю согласие на обработку персональных данных

Читайте еще

JetBrains объявляет о проведении фестиваля искусственного интеллекта в Академии ИИ

Компания JetBrains проводит фестиваль Академии ИИ, который, по ее словам, представляет собой сочетание практического обучения и вдохновляющих задач, которые вдохновят на инновации и помогут лучше понять машинное обучение и ИИ. Онлайн-мероприятие включает в себя ИИ-хакатон с призами для победителей.

22 февраля 2024 г.
30

Продолжаем добавлять языки программирования для Вас.
Впереди много интересного!

Только свежие новости программирования и технологий каждый день.

Свежие посты