Вийшла бібліотека PyWhat для автоматичного парсінгу трафіку

Розроблена зручна бібліотека PyWhat, яка допомагає класифікувати данні у неструктурованому масиві.

Наприклад, у вас декілька мегабайт трафіку, який записаний у стандартному форматі .pcap. Що з ним робити? PyWhat зпаристь всі рядки, виділить:

гаманці криптовалют
номера соціального страхування
кредитні картки
заголовки відеороликів Youtube ID
будь-які хеші
інші відомі типи даних

Так у трафіку набагато простіше орієнтуватися. Побачивши потрібний пакет, потім у Wireshark можна обрати інші пакети саме з цього потоку в реальному часі.

Насправді все те ж саме можна зробити з допомогою фільтрів у Wireshark, якщо шукати у трафіку щось конкретне, але ця бібліотека автоматизує процес та заощаджує час.

Або інший приклад. Всередині коду чи в якомусь файлі зустрічається невідомий рядок 5f4dcc3b5aa765d61d8327deb882cf99. Немає проблем. Запускаємо PyWhat – та дивимось, що це таке, з допомогою команди what “5f4dcc3b5aa765d61d8327deb882cf99”.

Читайте також: Представлений монітор ASUS ROG Strix XG259QN із частотою оновлення до 380 Гц і IPS-панеллю 1080p

Ціль команди what – з’ясувати походження строки символів, фрагменту, тексту всередині файлу чи якогось hex-значення. Загалом, бібліотека допомагає знайти структуровані дані в будь-якому файлі підтримує рекурсивний пошук файлів в директоріях, працює з API.