Компания Google выпустила набор легких открытых моделей, созданных на основе тех же исследований и технологий, которые использовались при создании недавних моделей Google Gemini.
Модели Gemma - это большие языковые модели, работающие только с декодером, доступные на английском языке, с открытыми весами, предварительно обученными вариантами и вариантами, настраиваемыми по инструкции.
Команда Gemma утверждает, что ее модели имеют общие технические и инфраструктурные компоненты с Gemini, что позволяет представленным моделям двух размеров - Gemma 2B и 7B - показывать хорошие результаты для своих размеров по сравнению с другими открытыми моделями. Модели Gemma могут работать непосредственно на ноутбуке или настольном компьютере разработчика.
По словам команды Gemma, модели разных размеров выпускаются с предварительно обученными и настроенными по инструкции вариантами. Релиз сопровождается новым набором инструментов ответственного генеративного ИИ, который содержит руководство и основные инструменты для создания безопасных приложений ИИ с помощью Gemma. Инструментарий содержит ресурсы для применения лучших практик ответственного использования открытых моделей, включая руководство по настройке политик безопасности, настройке безопасности, классификаторам безопасности и оценке моделей. В нем также есть инструмент под названием Learning Interpretability Tool (LIT), который можно использовать для изучения поведения Gemma и решения любых потенциальных проблем.
Google также предоставляет инструментальные цепочки для выводов и контролируемой тонкой настройки (SFT) в таких фреймворках, как JAX, PyTorch и TensorFlow, через встроенный Keras 3.0. Имеются готовые к использованию блокноты Colab и Kaggle, а программное обеспечение интегрировано с такими инструментами, как Hugging Face, MaxText, NVIDIA NeMo и TensorRT-LLM.
По словам Google, Gemma оптимизирована для нескольких аппаратных платформ ИИ, включая NVIDIA GPU и Google Cloud TPU. Облачная оптимизация осуществляется с помощью Vertex AI, который, по словам Google, предоставляет широкий набор инструментов MLOps с различными вариантами настройки и развертыванием в один клик с использованием встроенных оптимизаций вывода. Расширенная настройка доступна как с помощью полностью управляемых инструментов Vertex AI, так и с помощью самоуправляемого GKE.
Помимо Google Gemma, несколько версий моделей доступны на GitHub. Это официальная реализация моделей на Pytorch; легкий, автономный движок для выводов на C++ для базовых моделей Gemma; реализация выводов и примеры на основе Flax и JAX.
Google Gemma доступна уже сейчас.
Понравилась новость? Тогда не забудь оставить свой комментарий.
А так же, добавь наш сайт в закладки (нажми Ctrl+D), не теряй нас.
Комментарии