Розроблена зручна бібліотека PyWhat, яка допомагає класифікувати данні у неструктурованому масиві.

Наприклад, у вас декілька мегабайт трафіку, який записаний у стандартному форматі .pcap. Що з ним робити? PyWhat зпаристь всі рядки, виділить:
- гаманці криптовалют
- номера соціального страхування
- кредитні картки
- заголовки відеороликів Youtube ID
- будь-які хеші
- інші відомі типи даних
Так у трафіку набагато простіше орієнтуватися. Побачивши потрібний пакет, потім у Wireshark можна обрати інші пакети саме з цього потоку в реальному часі.
Насправді все те ж саме можна зробити з допомогою фільтрів у Wireshark, якщо шукати у трафіку щось конкретне, але ця бібліотека автоматизує процес та заощаджує час.
Або інший приклад. Всередині коду чи в якомусь файлі зустрічається невідомий рядок 5f4dcc3b5aa765d61d8327deb882cf99. Немає проблем. Запускаємо PyWhat – та дивимось, що це таке, з допомогою команди what “5f4dcc3b5aa765d61d8327deb882cf99”.

Ціль команди what – з’ясувати походження строки символів, фрагменту, тексту всередині файлу чи якогось hex-значення. Загалом, бібліотека допомагає знайти структуровані дані в будь-якому файлі підтримує рекурсивний пошук файлів в директоріях, працює з API.