Google добавляет Gemini в Bard

Компания Google объявила о том, что Gemini Pro доступна в Барде. Это крупнейшее обновление Bard с момента его запуска. Google также выпустила API Gemini и другие инструменты ИИ для разработчиков.

Gemini - это мультимодальная модель большого языка, разработанная Google DeepMind. Она была выпущена в нескольких версиях в качестве конкурента GPT-4 от OpenAI и преемника LaMDA и PaLM 2 от Google.

Gemini получил неоднозначные отзывы, и в работе группы исследователей из Университета Карнеги-Меллон он был охарактеризован как не лучше GPT-3.5 от OpenAI для большинства задач. Google утверждает, что в начале 2024 года будет выпущена более мощная версия под названием Gemini Ultra, которая по результатам внутренних исследований Google получила оценку выше GPT-4.

Тем временем видео, выпущенное на презентации и демонстрирующее работу Gemini, подверглось критике, поскольку, хотя оно выглядело впечатляюще, при ближайшем рассмотрении оказалось, что в ролике все не так, как кажется на первый взгляд.

Видеоролик Hands-on with Gemini: Interacting with multimodal AI набрал миллионы просмотров. Google описал его как "демонстрацию некоторых из наших любимых взаимодействий с Gemini" и сказал, что он показывает, как мультимодальная модель может быть гибкой и реагировать на различные входные данные.

Мультимодальность означает, что Gemini может реагировать на языковые и визуальные сигналы. В видеоролике Джемини показывают эскиз утки, начиная с самого начального наброска и заканчивая готовым рисунком, который, по мнению Джемини, вряд ли подходит по цвету для утки (бледно-голубой). Затем Джемини показывают синюю игрушечную утку, и он отвечает: "Что за кряканье!". Другие элементы видео показывают, как Джемини играет с диктором в камень-ножницы-бумагу и предлагает, что может произойти дальше в видео с кошкой. Все это выглядит очень впечатляюще.

Разгадка жалоб CMU кроется в том, что, хотя Google утверждает, что "задержка была снижена, а выходы Gemini сокращены", в более честном сопроводительном сообщении в блоге говорится, что исследователи Google сняли кадры Gemini в действии, работающего над широким спектром задач, а затем вызвали его, используя кадры изображений из видеозаписи и подсказки в виде текста, а не впечатляющие живые взаимодействия в видео.

Тем временем Google не останавливается на достигнутом, сообщив, что Gemini Pro доступен через Gemini API для разработчиков в Google AI Studio и для предприятий через платформу Google Cloud Vertex AI. Google также представляет другие модели в Vertex AI, в частности, обновленный Imagen 2 для преобразования текста в изображение, а также семейство базовых моделей, точно настроенных для индустрии здравоохранения.

Gemini также добавляется в Bard, разговорный чатбот Google, использующий искусственный интеллект. В Bard будет использоваться доработанная версия Gemini Pro, а сама функция будет доступна только на английском языке. По словам Google, в ближайшем будущем планируется расширить эту функцию, добавив в нее различные методы и поддержку новых языков и мест. По словам Google, Gemini Pro поможет Барду стать гораздо более способным в таких областях, как понимание, рассуждение и планирование.

Google добавляет Gemini в Bard
Понравилась новость? Тогда не забудь оставить свой комментарий.
А так же, добавь наш сайт в закладки (нажми Ctrl+D), не теряй нас.
20 декабря 2023 г.
50

Комментарии

Оставить комментарий:
* отправляя форму, я даю согласие на обработку персональных данных

Читайте еще

Продолжаем добавлять языки программирования для Вас.
Впереди много интересного!

Только свежие новости программирования и технологий каждый день.