Вышла Kimi K2 Thinking – свежая open source-модель для сложных рассуждений и агентных задач

habr.com:

Она способна выполнять до 300 последовательных действий, строя цепочку логики, поиска и кода. Эта модель — очередной шаг в направлении масштабирования вычислений во время выполнения, благодаря увеличению как количества «токенов размышления», так и числа шагов при вызове инструментов.Kimi K2 Thinking устанавливает новые рекорды на бенчмарках, оценивающих логическое мышление, кодинг и агентные способности.Немного про бенчмарки:K2 Thinking демонстрирует выдающиеся способности к логике и решению задач.

На Humanity’s Last Exam (HLE) — строго разработанном бенчмарке с закрытыми вопросами экспертного уровня по более чем 100 предметам — модель достигла 44,9%, используя инструменты для поиска, Python и веб-браузер.K2 Thinking показывает значительный прогресс в задачах кодинга и разработки ПО.

Читать на habr.com Все новости от habr.com

Вышла FLUX.2 — open source-конкурент Nano Banana

Бесплатная конференция о разработке системного ПО, ядрах Linux и open source пройдёт 3 декабря в Москве

Anthropic представили Claude Opus 4.5: лучшую в мире модель для кодинга и агентов

Вышел Mux — open source-инструмент, где над кодом работают несколько разных ИИ

Вышла FLUX.2 — open source-конкурент Nano Banana

Бесплатная конференция о разработке системного ПО, ядрах Linux и open source пройдёт 3 декабря в Москве

Anthropic представили Claude Opus 4.5: лучшую в мире модель для кодинга и агентов

Вышел Mux — open source-инструмент, где над кодом работают несколько разных ИИ

Gemini 3 Pro назвали лучшим ИИ для сложной математики

Ai2 выпускает Deep Research Tulu — открытую модель для глубокого исследования информации

В «Яндекс Картах» появился ИИ-помощник на базе технологий Alice AI для решения нестандартных городских задач