МЕТОДИКА ОПРЕДЕЛЕНИЯ КРИТИЧНОСТИ УЯЗВИМОСТЕЙ С ИСПОЛЬЗОВАНИЕМ ТЕХНОЛОГИЙ BERT И RANDOM FOREST
##plugins.themes.bootstrap3.article.main##
Аннотация
В статье исследуется задача автоматического прогнозирования оценки критичности CVSS Score (Common Vulnerability Scoring System) на базе текстовых описаний уязвимостей CVE (Common Vulnerabilities and Exposures). Представлен подход, совмещающий методы NLP (Natural Language Processing) и машинного обучения. Выполнен разбор имеющихся решений, обозначены основные проблемы: неоднородность текстовых данных, дисбаланс классов в CVSS Score, необходимость интерпретируемости модели. Спроектирована и протестирована модель, продемонстрировавшая точность предсказания на наборе данных NVD (National Vulnerability Database). Полученные результаты сопоставлены с аналогами из других исследований. Практическая значимость работы — автоматизация анализа уязвимостей для SOC-команд (Security Operations Center) и кибербезопасности