OpenAI продолжает делать искусственный интеллект доступнее. Встречайте GPT-4o mini — нашу самую экономичную компактную модель. Мы ожидаем, что GPT-4o mini значительно расширит спектр приложений на базе ИИ, сделав технологии более доступными.

GPT-4o mini демонстрирует впечатляющие результаты:

82% на тесте MMLU (многозадачное обучение с языковой моделью)
Превосходит GPT-41 в предпочтениях пользователей в чате на платформе LMSYS

Доступная цена:

15 центов за миллион входных токенов
60 центов за миллион выходных токенов

Это на порядок дешевле, чем у предыдущих передовых моделей, и более чем на 60% дешевле, чем у GPT-3.5 Turbo.

Широкий спектр возможностей

Низкая стоимость и задержка GPT-4o mini открывают возможности для решения разнообразных задач, включая:

Приложения с последовательным или параллельным вызовом нескольких моделей (например, вызов нескольких API)
Обработка большого объема контекста (например, полная кодовая база или история разговора)
Взаимодействие с клиентами через быстрые текстовые ответы в режиме реального времени (например, чат-боты службы поддержки)

Мультимодальные возможности

На сегодняшний день GPT-4o mini в API поддерживает текст и изображения, а в будущем планируется добавить поддержку ввода и вывода текста, изображений, видео и аудио.

Ключевые характеристики:

Контекстное окно: 128 тысяч токенов
Поддержка до 16 тысяч выходных токенов на запрос
База знаний обновлена до октября 2023 года
Улучшенная обработка неанглийского текста благодаря новому токенизатору, общему с GPT-4o.

GPT-4o mini: доступный ИИ для широкого круга задач

Превосходный интеллект и многомодальное мышление

GPT-4o mini превосходит GPT-3.5 Turbo и другие компактные модели по академическим тестам, как в текстовом интеллекте, так и в многомодальном мышлении. Модель поддерживает тот же набор языков, что и GPT-4o. Она также демонстрирует высокую производительность в вызове функций, что позволяет разработчикам создавать приложения, которые получают данные или взаимодействуют с внешними системами.

Результаты тестов:

MMLU (текстовый интеллект и рассуждения): 82,0% (Gemini Flash — 77,9%, Claude Haiku — 73,8%)
MGSM (математические рассуждения): 87,0% (Gemini Flash — 75,5%, Claude Haiku — 71,7%)
HumanEval (производительность кодирования): 87,2% (Gemini Flash — 71,5%, Claude Haiku — 75,9%)
MMMU (многомодальное мышление): 59,4% (Gemini Flash — 56,1%, Claude Haiku — 50,2%)

Безопасность на первом месте

Безопасность заложена в наши модели с самого начала и усиливается на каждом этапе разработки.

Меры безопасности:

Предварительная подготовка: фильтрация нежелательной информации (например, разжигание ненависти, контент для взрослых, спам)
Посттренировка: использование методов обучения с подкреплением на основе обратной связи с человеком (RLHF) для повышения точности и надежности ответов
Применение иерархии инструкций: повышение устойчивости к взломам, внедрению кода и извлечению системных подсказок

Доступность и цены

GPT-4o mini уже доступна в API Assistants, API Chat Completions и API Batch. Планируется в ближайшее время добавить возможность тонкой настройки.

GPT-4o mini в ChatGPT:

Пользователи Free, Plus и Team получат доступ к GPT-4o mini уже сегодня, вместо GPT-3.5.
Корпоративные пользователи получат доступ на следующей неделе.

Взгляд в будущее

Мы наблюдаем стремительный прогресс в области ИИ, сопровождающийся существенным снижением стоимости. Например, стоимость токена GPT-4o mini снизилась на 99% по сравнению с text-davinci-003, менее мощной моделью, представленной в 2022 году.

Мы стремимся к тому, чтобы модели стали неотъемлемой частью каждого приложения и веб-сайта. GPT-4o mini — это шаг к тому, чтобы сделать разработку и масштабирование мощных приложений ИИ более эффективной и доступной.