Беплатная нейросеть Kimi K2-Thinking обошла GPT-5 в одном из самых сложных бенчмарков
Вслед за запуском Kimi K2-Thinking, компания Moonshot AI опубликовала подробный блог-пост с описанием модели, а также выпустила ее открытые веса (ранее модель вышла в API и чате, причем в чате она бесплатна).
По бенчмаркам видно, что новинка идет на равных с лидирующими коммерческими ИИ: GPT-5, Claude Sonnet 4.5 и Grok 4.Отдельно стоит отметить первое место в Humanity's Last Exam - большой мультидисциплинарный тест из порядка 3000 задач по математике, естественным и гуманитарным наукам.
habr.com