Ведущие модели ИИ пока не могут решать оригинальные математические задачи

Ученые из США провели эксперимент по оценке способностей ИИ решать исследовательские задачи по математике.
ИИ столкнулся с неопубликованными проблемами из текущего исследования авторов.
Десять задач охватывали различные области математики.
Эксперимент был разработан с большой строгостью для проверки финального этапа исследования.
Исследователи самостоятельно решили свои задачи и зашифровали ответы.
Задачи были из разных областей математики.
В качестве подопытных выступали ведущие модели ИИ, включая GPT-5.1 Pro и Gemini 3 Pro.
ИИ не смог справиться с задачами за одну попытку.
Ученые планируют превратить First Proof в постоянный эталонный тест для оценки прогресса ИИ в решении сложных математических проблем.

Исследователи пришли к выводу, что современный ИИ пока не обладает необходимой творческой глубиной и интуицией для ориентации в неизведанных исследовательских проблемах. Возможно, это успокоит тех, кто опасается, что ИИ вскоре заменит их.