«Сэму Альтману пока не о чем беспокоиться»: Grok-3 не обгоняет топовые решения OpenAI
В понедельник Илон Маск презентовал Grok-3 — новую версию чат‑бота от xAI, заявив, что он «на порядок мощнее» своей предыдущей версии.
Некоторые эксперты и исследователи ИИ протестировали Grok-3 и дали неоднозначные отзывы.Маск утверждает, что новый бот превосходит GPT-4o от OpenAI, а также решения от Google, DeepSeek и Anthropic по ключевым показателям в математике, науке и программировании. «Мы ежедневно улучшаем модели, и буквально за 24 часа вы сможете увидеть прогресс», — заявил Маск во время прямой трансляции на платформе X, где его сопровождали три инженера xAI.Андрей Карпатый, сооснователь OpenAI и бывший руководитель ИИ‑направления в Tesla, отметил в посте на X, что Grok-3 успешно справляется с поиском сложной информации в обучающих материалах, однако, подобно OpenAI o1-pro, он испытывает затруднения при решении хитроумных партий в крестики‑нолики. «В целом создаётся впечатление, что этот уровень сопоставим с o1-pro и немного опережает DeepSeek‑r1.
habr.com