GPT-4o mini: доступный ИИ для широкого круга задач

OpenAI продолжает делать искусственный интеллект доступнее. Встречайте GPT-4o mini — нашу самую экономичную компактную модель. Мы ожидаем, что GPT-4o mini значительно расширит спектр приложений на базе ИИ, сделав технологии более доступными.
GPT-4o mini демонстрирует впечатляющие результаты:
- 82% на тесте MMLU (многозадачное обучение с языковой моделью)
- Превосходит GPT-41 в предпочтениях пользователей в чате на платформе LMSYS
Доступная цена:
- 15 центов за миллион входных токенов
- 60 центов за миллион выходных токенов
Это на порядок дешевле, чем у предыдущих передовых моделей, и более чем на 60% дешевле, чем у GPT-3.5 Turbo.
Широкий спектр возможностей
Низкая стоимость и задержка GPT-4o mini открывают возможности для решения разнообразных задач, включая:
- Приложения с последовательным или параллельным вызовом нескольких моделей (например, вызов нескольких API)
- Обработка большого объема контекста (например, полная кодовая база или история разговора)
- Взаимодействие с клиентами через быстрые текстовые ответы в режиме реального времени (например, чат-боты службы поддержки)
Мультимодальные возможности
На сегодняшний день GPT-4o mini в API поддерживает текст и изображения, а в будущем планируется добавить поддержку ввода и вывода текста, изображений, видео и аудио.
Ключевые характеристики:
- Контекстное окно: 128 тысяч токенов
- Поддержка до 16 тысяч выходных токенов на запрос
- База знаний обновлена до октября 2023 года
- Улучшенная обработка неанглийского текста благодаря новому токенизатору, общему с GPT-4o.


Превосходный интеллект и многомодальное мышление
GPT-4o mini превосходит GPT-3.5 Turbo и другие компактные модели по академическим тестам, как в текстовом интеллекте, так и в многомодальном мышлении. Модель поддерживает тот же набор языков, что и GPT-4o. Она также демонстрирует высокую производительность в вызове функций, что позволяет разработчикам создавать приложения, которые получают данные или взаимодействуют с внешними системами.
Результаты тестов:
- MMLU (текстовый интеллект и рассуждения): 82,0% (Gemini Flash — 77,9%, Claude Haiku — 73,8%)
- MGSM (математические рассуждения): 87,0% (Gemini Flash — 75,5%, Claude Haiku — 71,7%)
- HumanEval (производительность кодирования): 87,2% (Gemini Flash — 71,5%, Claude Haiku — 75,9%)
- MMMU (многомодальное мышление): 59,4% (Gemini Flash — 56,1%, Claude Haiku — 50,2%)
Безопасность на первом месте
Безопасность заложена в наши модели с самого начала и усиливается на каждом этапе разработки.
Меры безопасности:
- Предварительная подготовка: фильтрация нежелательной информации (например, разжигание ненависти, контент для взрослых, спам)
- Посттренировка: использование методов обучения с подкреплением на основе обратной связи с человеком (RLHF) для повышения точности и надежности ответов
- Применение иерархии инструкций: повышение устойчивости к взломам, внедрению кода и извлечению системных подсказок
Доступность и цены
GPT-4o mini уже доступна в API Assistants, API Chat Completions и API Batch. Планируется в ближайшее время добавить возможность тонкой настройки.
GPT-4o mini в ChatGPT:
- Пользователи Free, Plus и Team получат доступ к GPT-4o mini уже сегодня, вместо GPT-3.5.
- Корпоративные пользователи получат доступ на следующей неделе.
Взгляд в будущее
Мы наблюдаем стремительный прогресс в области ИИ, сопровождающийся существенным снижением стоимости. Например, стоимость токена GPT-4o mini снизилась на 99% по сравнению с text-davinci-003, менее мощной моделью, представленной в 2022 году.
Мы стремимся к тому, чтобы модели стали неотъемлемой частью каждого приложения и веб-сайта. GPT-4o mini — это шаг к тому, чтобы сделать разработку и масштабирование мощных приложений ИИ более эффективной и доступной.





