Вышла Kimi K2 Thinking – свежая open source-модель для сложных рассуждений и агентных задач
Она способна выполнять до 300 последовательных действий, строя цепочку логики, поиска и кода. Эта модель — очередной шаг в направлении масштабирования вычислений во время выполнения, благодаря увеличению как количества «токенов размышления», так и числа шагов при вызове инструментов.Kimi K2 Thinking устанавливает новые рекорды на бенчмарках, оценивающих логическое мышление, кодинг и агентные способности.Немного про бенчмарки:K2 Thinking демонстрирует выдающиеся способности к логике и решению задач.
На Humanity’s Last Exam (HLE) — строго разработанном бенчмарке с закрытыми вопросами экспертного уровня по более чем 100 предметам — модель достигла 44,9%, используя инструменты для поиска, Python и веб-браузер.K2 Thinking показывает значительный прогресс в задачах кодинга и разработки ПО.
habr.com