Grok 4.20 значительно отстает от Gemini и ChatGPT, но устанавливает новый рекорд по отсутствию галлюцинаций
В тестах производительности Grok 4.20 от xAI не может сравниться с лучшими ИИ, но демонстрирует меньше галлюцинаций, чем любая другая протестированная модель. По данным Artificial Analysis, Grok 4.20 Beta набирает 48 баллов по индексу интеллекта с включенным логическим мышлением, что значительно меньше, чем у Gemini 3.1 Pro Preview и GPT-5.4 (57 баллов), но все же на 6 баллов лучше, чем у Grok 4.xAI выпустила три варианта API: с логическим выводом, без логического вывода и в многоагентном режиме.
Модель поддерживает контекстное окно в 2 миллиона токенов и стоит 2 или 6 долларов за миллион токенов; это дешевле, чем Grok 4, и конкурентоспособно по цене среди западных моделей.Главное достоинство Grok 4.20 - это, как ни странно, фактическая достоверность.
habr.com