Google открыла код проекта Magika для определения типа содержимого файлов
Google объявила об открытии кода системы идентификации типов файлов на базе искусственного интеллекта Magika. Она позволяет точно определять в содержимом используемые языки программирования, методы сжатия, установочные пакеты, исполняемый код, виды разметки, форматы звука, видео, документов и изображений.
Инструментарий и готовая модель машинного обучения опубликованы под лицензией Apache 2.0. Установить Magika можно как пакет для Python и JavaScript-библиотеку, способную работать в браузере или в проектах на базе Node.js.