GPT-5.2 Pro назвали лучшим ИИ для сложной математики
Год назад лучшие языковые модели решали около 2% задач бенчмарка FrontierMath. 30 декабря 2025 года GPT-5.2 Pro от OpenAI заняла первое место в самой сложной категории этого бенчмарка — Tier 4 — с результатом 29.2%.
Предыдущий лидер, Gemini 3 Pro Preview от Google, набрал 18.8%. На базовом наборе задач (Tier 1-3) модели OpenAI тоже лидируют: GPT-5.2 Thinking показывает 40.7% против 37.6% у Gemini 3 Pro.FrontierMath — бенчмарк от Epoch AI, состоящий из нескольких сотен оригинальных математических задач.
habr.com