DeepSeek V4 силен только в «своих» бенчмарках. На независимых — отстает на 8 месяцев
После анонса DeepSeek V4 Pro, в котором компания заявила об отставании от фронтира США всего на 3–6 месяцев, NIST — американский институт стандартов при Министерстве торговли — провел собственные замеры и заявил, что в реальности модель позади как минимум на 8 месяцев.
Расхождение объясняется одним фактором — выбором бенчмарков.Логика теста простая. Когда DeepSeek готовила свой технический отчет, она сама выбирала, на каких бенчмарках будет сравнивать модель с конкурентами.
habr.com