CUDA L2 показывает, что ИИ может писать GPU ядра быстрее инженеров NVIDIA
Исследовательская команда DeepReinforce представила систему CUDA L2, которая автоматически генерирует GPU код для матричного умножения и делает это так эффективно, что созданные ею HGEMM ядра обгоняют cuBLAS и cuBLASLt в среднем на 10–30 процентов.
Эти библиотеки создаются вручную специалистами NVIDIA и считаются эталоном оптимизации, поэтому такой результат вызвал серьёзный интерес в индустрии.CUDA L2 полностью меняет привычный подход к оптимизации.
habr.com