- Ученые из США провели эксперимент по оценке способностей ИИ решать исследовательские задачи по математике.
- ИИ столкнулся с неопубликованными проблемами из текущего исследования авторов.
- Десять задач охватывали различные области математики.
- Эксперимент был разработан с большой строгостью для проверки финального этапа исследования.
- Исследователи самостоятельно решили свои задачи и зашифровали ответы.
- Задачи были из разных областей математики.
- В качестве подопытных выступали ведущие модели ИИ, включая GPT-5.1 Pro и Gemini 3 Pro.
- ИИ не смог справиться с задачами за одну попытку.
- Ученые планируют превратить First Proof в постоянный эталонный тест для оценки прогресса ИИ в решении сложных математических проблем.
Исследователи пришли к выводу, что современный ИИ пока не обладает необходимой творческой глубиной и интуицией для ориентации в неизведанных исследовательских проблемах. Возможно, это успокоит тех, кто опасается, что ИИ вскоре заменит их.