runawayllm медицина финансы самит интересное google gemini runawayllm

Perplexity обошел Google и OpenAI в глубоком поиске и запустил «совет моделей»

Компания Perplexity выпустила сразу два крупных обновления: Advanced-версию Deep Research и функцию Model Council. Обновленный глубокий поиск работает на Claude Opus 4.5 от Anthropic и занял первое место в лидерборде Google DeepMind Deep Search QA с результатом 79.5% — выше, чем у Moonshot K2.5 (77.1%), самого Opus 4.5 без обвязки Perplexity (76.1%), GPT-5.2 (71.3%) и Gemini Deep Research Agent от Google (66.1%).Компания также представила собственный бенчмарк DRACO (Deep Research Accuracy, Completeness and Objectivity) и выложила его в открытый доступ.

Он включает 100 задач в 10 доменах — от финансов и медицины до права и шопинга, каждая оценивается по ~40 экспертным критериям.

DMCA