runawayllm самит gemini runawayllm

GPT-5 отказался работать, Gemini назвал жалобу «необоснованной»: авторы Ubuntu протестировали ИИ на своей документации

Салли Макин из команды документации Ubuntu Server провела серию экспериментов с LLM на реальных задачах — и выложила все промпты и скрипты в открытый доступ.Тестировались Claude Sonnet 4.5, Claude Haiku 4.5, GPT-5, GPT-5-mini и Gemini 3 Pro.

Первая задача — перевести документацию с британского английского на американский. Claude Sonnet справился на 7 из 10, GPT-5 получил ноль баллов — просто отказался выполнять задачу без объяснения причин.

DMCA