Согласно информации от OpenAI, новая языковая модель обладает логическим мышлением и способностью к аналитическим рассуждениям.

«Человечность» этого интеллекта заключается в умении разбивать сложные задачи на более простые и корректировать свои ошибки. В компании утверждают, что эта модель превосходит GPT-4o в области логики: в то время как GPT-4o справляется лишь с 13% задач на тестах AIME, новая модель — с 83%.
Модель также состязалась с живыми участниками. Например, она заняла 49-е место на Международной олимпиаде по информатике и превзошла 89% участников на платформе Codeforces. Кроме того, она вошла в число 500 лучших студентов на квалификационном этапе Американской математической олимпиады. Представители OpenAI сообщают, что в области естественных наук модель показала более высокие результаты в тесте GPQA diamond по физике, биологии и химии по сравнению с кандидатами наук:
Однако данная модель не умеет анализировать веб-страницы, файлы и изображения так, как это делает GPT-4o. Кроме того, GPT-4o более быстр и дешев, стоящее использование новой модели составляет 15 долларов за 1 миллион входящих токенов, тогда как за GPT-4o — 5 долларов за такой же объем.