Как отличить файлы doc, ppt, xls, не глядя на расширение файла

Поэтому мне было интересно, как бы вы дифференцировали файлы ppt, xls и doc друг от друга в Linux независимо от расширений. Я попробовал «файл», но из-за его внешнего вида все файлы MSOffice классифицируются под одним и тем же типом файла. Аналогично, у меня возникают проблемы с файлами docx, xlsx и pptx, поскольку они представляют собой, по существу, все файлы zip, содержащие кучу xml.

Я также попробовал скрипт python, импортирующий магический модуль, но не пошел.

Я пытаюсь определить фактический файл для анализа песочницы. И для этой конкретной цели мне нужно найти фактический тип файла, чтобы запустить его в песочнице vm (Windows vm запускает все по расширению).

Скажем, файл образца помечен как try.exe, но на самом деле это всего лишь файл doc. Мой скрипт переименует его как try.exe.doc, который отлично подходит для файлов doc. Но так как linux идентифицирует все файлы MSOffice как простые файлы DOC, тогда нет возможности идентифицировать файлы ppt или xls. В результате песочница не будет правильно анализировать образец.