Компания OpenAI представила свои самые мощные ИИ-модели — o3 и o3-mini. Эти новинки оказались более продвинутыми по сравнению с предыдущей линейкой моделей o1. Они были названы с пропуском цифры 2, что связано с возможными юридическими проблемами с британским оператором O2, зарегистрировавшим этот бренд. Глава OpenAI Сэм Альтман отметил, что выбор названий следует традиции компании.
По данным OpenAI, модель o3 показала выдающиеся результаты в ARC-бенчмарке, набрав 87,5% — значительно выше среднего показателя людей (около 85%) и намного лучше, чем o1, которая достигала лишь 32%. Однако стоимость выполнения задач на новой модели может составить около $2 000 (206 000 рублей).
Кроме того, o3 продемонстрировала отличные результаты на специальном экзамене по математике в США, набрав 96,7 балла и не справившись лишь с одним вопросом. В бенчмарке Frontier Math модель установила рекордный показатель в 25,2%, в то время как другие модели не смогли набрать больше 2%. Результаты o3-mini оказались более скромными, но в OpenAI уверены, что она превосходит o1 по своим возможностям.
На данный момент обе модели недоступны для широкой аудитории. Разработчики продолжают процесс их обучения и собирают заявки от исследователей для тестирования o3 и o3-mini. О сроках полноценного релиза в OpenAI пока не сообщают.
Фото: freepik, OpenAI