OpenAI анонсировала языковые модели нового поколения o3 и o3-mini, которые обладают способностью «рассуждать». Прежде чем ответить на вопрос пользователя, модель выстраивает цепочку рассуждений, поэтому ответ получается более точным.
По сообщению компании, модель o3 бьет рекорды производительности по всем направлениям. Например, данная версия ИИ на 22,8% превзошла возможности o1 в написании кода (тест SWE-Bench Verified). Кроме того, модель опередила научного сотрудника OpenAI в спортивном программировании. Также модель едва не выиграла одно из сложнейших математических соревнований AIME 2024, пропустив в нем один вопрос, и набрала в тесте для экспертов GPQA Diamond 87,7%.
Компания сообщила, что пока модели o3 и o3-mini продолжают обучаться, поэтому окончательные результаты их работы могут еще измениться. Сейчас OpenAI принимает заявки на тестирование моделей перед официальным запуском, дата которого пока неизвестна.
Напомним, предыдущая модель o1 была представлена в сентябре 2024 года. OpenAI специально пропустила одну цифру и назвала следующую модель o3, а не o2, чтобы нейросеть не спутали с британской телекоммуникационной компанией O2.
Комментарии закрыты, но трэкбэки и Pingbacks открыты.