Вийшла бібліотека PyWhat для автоматичного парсінгу трафіку

Розроблена зручна бібліотека PyWhat, яка допомагає класифікувати данні у неструктурованому масиві.

бібліотека PyWhat

Наприклад, у вас декілька мегабайт трафіку, який записаний у стандартному форматі .pcap. Що з ним робити? PyWhat зпаристь всі рядки, виділить:

  • гаманці криптовалют
  • номера соціального страхування
  • кредитні картки
  • заголовки відеороликів Youtube ID
  • будь-які хеші
  • інші відомі типи даних

Так у трафіку набагато простіше орієнтуватися. Побачивши потрібний пакет, потім у Wireshark можна обрати інші пакети саме з цього потоку в реальному часі.

Насправді все те ж саме можна зробити з допомогою фільтрів у Wireshark, якщо шукати у трафіку щось конкретне, але ця бібліотека автоматизує процес та заощаджує час.

Або інший приклад. Всередині коду чи в якомусь файлі зустрічається невідомий рядок 5f4dcc3b5aa765d61d8327deb882cf99. Немає проблем. Запускаємо PyWhat – та дивимось, що це таке, з допомогою команди what “5f4dcc3b5aa765d61d8327deb882cf99”.

Ціль команди what – з’ясувати походження строки символів, фрагменту, тексту всередині файлу чи якогось hex-значення. Загалом, бібліотека допомагає знайти структуровані дані в будь-якому файлі підтримує рекурсивний пошук файлів в директоріях, працює з API.