OpenAI сокращает расходы на ИИ с помощью высокопроизводительного GPT-4o mini

Компания OpenAI анонсировала GPT-4o mini, небольшую модель, призванную сделать искусственный интеллект более доступным для разработчиков. Это новое пополнение в семействе GPT обещает превосходную производительность по цене в разы ниже предыдущих моделей, включая обычный GPT-4o.

GPT-4o mini по-прежнему обладает впечатляющими возможностями: он набрал 82 % в бенчмарке MMLU и превзошел GPT-4 по предпочтениям в чате в таблице лидеров LMSYS. Цена модели составляет всего 15 центов за миллион входных токенов и 60 центов за миллион выходных токенов, что делает ее значительно более экономичной, чем ее предшественники.

Ключевые особенности:

  • Низкая стоимость и задержка
  • Контекстное окно на 128 тыс. токенов
  • До 16 тыс. выходных токенов на один запрос
  • Отключение знаний: Октябрь 2023 года
  • Улучшенный токенизатор для эффективной работы с неанглийскими текстами
  • Поддержка текста и зрения в API (с будущим расширением для включения видео и аудио)

GPT-4o mini превосходит другие малые модели в различных бенчмарках:

  • MMLU (текстовый интеллект): 82.0%
  • MGSM (математический интеллект): 87.0%
  • HumanEval (производительность кодирования): 87.2%
  • MMMU (мультимодальные рассуждения): 59.4%

Эти результаты демонстрируют превосходство GPT-4o mini в задачах на рассуждение, математику, кодирование и мультимодальное понимание по сравнению с такими конкурентами, как Gemini Flash и Claude Haiku.

Разработчики могут использовать GPT-4o mini для широкого спектра приложений, включая:

  • Цепочка или распараллеливание нескольких вызовов модели
  • Передача больших объемов контекста (например, полных баз кода или историй разговоров)
  • Построение систем текстовых ответов в реальном времени (например, чат-ботов для поддержки клиентов).

При разработке GPT-4o mini компания OpenAI уделила особое внимание безопасности, реализовав фильтрацию контента перед обучением, выравнивание после обучения с помощью таких техник, как RLHF, а также инновационный метод «иерархии инструкций» для защиты от джейлбрейков и инъекций.

GPT-4o mini теперь доступен через API ассистентов, API завершений чата и Batch API. Разработчики могут рассчитывать на оплату в 15 центов за 1 млн входных токенов и 60 центов за 1 млн выходных токенов. Возможности тонкой настройки будут расширены в ближайшие дни.

«Мы представляем себе будущее, в котором модели будут органично интегрированы в каждое приложение и на каждый сайт. GPT-4o mini открывает разработчикам путь к созданию и масштабированию мощных приложений ИИ более эффективно и доступно», - поясняет OpenAI.

Поскольку ИИ продолжает развиваться, GPT-4o mini - это шаг к тому, чтобы сделать передовые языковые модели более доступными для разработчиков всех уровней». Благодаря впечатляющей производительности и экономичности эта новая модель поможет открыть новую эру приложений и сервисов на базе ИИ, а мы с нетерпением ждем GPT-5».

OpenAI сокращает расходы на ИИ с помощью высокопроизводительного GPT-4o mini
Понравилась новость? Тогда не забудь оставить свой комментарий.
А так же, добавь наш сайт в закладки (нажми Ctrl+D), не теряй нас.
20 июля 2024 г.
26
Теги: OpenAI

Комментарии

Оставить комментарий:
* отправляя форму, я даю согласие на обработку персональных данных

Читайте еще

Artificial Agency выходит из невидимости с «поведенческим движком» ИИ

Artificial Agency - ИИ-стартап, специализирующийся на генеративном поведении в играх, - вышел из режима скрытности, получив финансирование в размере 16 миллионов долларов США от Radical Ventures, Toyota Ventures и других известных инвесторов.

20 июля 2024 г.
35

Генеративный искусственный интеллект не поможет решить проблему миграции в облаках

Вы наверняка слышали о том, что генеративный искусственный интеллект решит все проблемы с миграцией в облако. На самом деле все не так просто. Генеративный ИИ может усложнить задачу и сделать ее более дорогостоящей.

14 июля 2024 г.
50

Amazon объявляет о постепенном совершенствовании искусственного интеллекта, чтобы противостоять конкурентам

Среди ключевых обновлений - расширенная память для автоматизации задач агентами ИИ, улучшенные предложения кода в чатботе Q и улучшенное обнаружение галлюцинаций в сервисе Bedrock.

11 июля 2024 г.
38

Продолжаем добавлять языки программирования для Вас.
Впереди много интересного!

Только свежие новости программирования и технологий каждый день.

Свежие посты