Tiger Lake denis19 ice intel AMD Tiger Lake denis19

Разработчики проекта FFmpeg добились 100х производительности в rangedetect8_avx512, благодаря ассемблерному коду

Разработчики открытого мультимедиа‑пакета FFmpeg заявили, что смогли добиться 100-кратной производительности в работе функции rangedetect8_avx512, благодаря новому патчу и искусству рукописного ассемблерного кода.Исходный код фильтра был переписан с использованием концепции обработки SIMD (Single Instruction, Multiple Data) для значительно улучшенной параллельной обработки на современных мощных процессорах.

Очевидно, что компиляторы — программы, которые берут код на языке высокого уровня и выдают ассемблерный (машинный) код — всё ещё не могут конкурировать с рукописным ассемблером.

DMCA