Tencent открыла HPC-Ops, библиотеку для максимальной выжимки из H100 и H200
Продакшен больших моделей давно превратился в соревнование за проценты эффективности. Когда счет идет на тысячи GPU, даже небольшой прирост скорости напрямую превращается в миллионы долларов экономии.
Tencent Hunyuan AI Infra выложила в open source HPC-Ops, библиотеку, на которой работает их собственная продакшен инфраструктура.Ключевая идея простая и радикальная.
habr.com