Машинное обучение (построение математических моделей) сейчас начинает применяться в самых неожиданных областях.
Как еще один пример этому мы хотим рассказать о наших опытах применения Machine Learning как альтернативы DPI. DPI (Deep Packet Inspection - глубокий анализ интернет пакетов) используется интернет провайдерами для анализа трафика и, в т. ч., выявления в общем потоке протоколов прикладного уровня. Попросту говоря, провайдер пытается заглянуть "внутрь" каждого проходящего интернет пакета, чтобы понять, что там делают клиенты (смотрят видео, используют чат, VPN, торрент и т.д)
Классические методы DPI уже не справляются с этой задачей, так как практически повсеместно уже используется шифрование трафика. И, как очередной раз показали последние события с Telegram, использование сигнатур ip/порт для определения протокола также не работают. Мы создали систему, которая определяет интернет протокол прикладного уровня (принадлежность к сервисам и приложениям) используя только статистические метрики потока на основе машинного обучения.
Для определения используются только размеры первых N пакетов (как показал эксперимент, достаточно трех!)
Подробное описание и рабочий прототип смотрите тут.