ОПЫТ РАЗРАБОТКИ ПРОГРАММНОЙ РЕАЛИЗАЦИИ КЛАССИФИКАТОРА ДЛЯ АВТОМАТИЗАЦИИ ОБНАРУЖЕНИЯ ФАКТОВ ИСПОЛЬЗОВАНИЯ КРИПТОКОШЕЛЬКОВ В ПРОТИВОПРАВНОЙ ДЕЯТЕЛЬНОСТИ
##plugins.themes.bootstrap3.article.main##
Аннотация
В статье обсуждается методика построения бинарного классификатора для выявления криптокошельков, связанных с программами-вымогателями. Был создан датасет из 41698 адресов, из них 20849 адресов, связанных с программами-вымогателями и 20849 адресов, несвязанных с программами вымогателями. Для каждого из кошельков было выделено 53 признака. Для построения классификаторов использовались следующие алгоритмы: логистическая регрессия, k-ближайших соседей, деревья
принятия решений, случайный лес, градиентный бустинг. Был осуществлен подбор
гиперпараметров классификаторов. Для оценки качества классификаторов использовались метрики: accuracy, precision, recall, F1
, ROC-AUC и кривые ROC. По метрикам
accuracy (95.54%), precision (92.40%), F1
(94.24%) лучший результат показал градиентный бустинг, по метрике recall (99.15%) – логистическая регрессия, по метрике ROCAUC (98.85%) – случайный лес. По кривым ROC – случайный лес и градиентный бустинг