Download - diploma-prezentation
![Page 1: diploma-prezentation](https://reader036.vdocuments.net/reader036/viewer/2022071907/55ca51e4bb61eb59138b4639/html5/thumbnails/1.jpg)
Проблема фильтрации спама
Определение
Спам - нежелательная почта. Та почта, которую пользовательне хотел бы получить даже зная о факте ее отправки.
Определение
Задача фильтрации спама - задача обнаруженияспам-сообщений для их последующего отсеивания из потокавходящей почты.
![Page 2: diploma-prezentation](https://reader036.vdocuments.net/reader036/viewer/2022071907/55ca51e4bb61eb59138b4639/html5/thumbnails/2.jpg)
Статистический подход к фильтрации спама
![Page 3: diploma-prezentation](https://reader036.vdocuments.net/reader036/viewer/2022071907/55ca51e4bb61eb59138b4639/html5/thumbnails/3.jpg)
Персонифицированный и неперсонифицированныйподходы
![Page 4: diploma-prezentation](https://reader036.vdocuments.net/reader036/viewer/2022071907/55ca51e4bb61eb59138b4639/html5/thumbnails/4.jpg)
Многопрофильный подход
Для классификации используются как собственные письма, таки письма от других пользователей
![Page 5: diploma-prezentation](https://reader036.vdocuments.net/reader036/viewer/2022071907/55ca51e4bb61eb59138b4639/html5/thumbnails/5.jpg)
Постановка задачи
Произвести обзор открытых систем фильтрации спама ивыбрать средство для расширения.Реализовать в рамках выбранного средства алгоритмклассификации на базе метода опорных векторов в работеА. Розинкина.Разработать модификацию метода, которая позволитклассифицировать сообщения по нескольким профилямРеализовать данную модификацию в рамках выбранногоранее средстваПроизвести экспериментальное исследование
![Page 6: diploma-prezentation](https://reader036.vdocuments.net/reader036/viewer/2022071907/55ca51e4bb61eb59138b4639/html5/thumbnails/6.jpg)
Метод опорных векторов
Разделяющая гиперплоскость максимально удалена отобъектов обоих классов
![Page 7: diploma-prezentation](https://reader036.vdocuments.net/reader036/viewer/2022071907/55ca51e4bb61eb59138b4639/html5/thumbnails/7.jpg)
Представление письма в виде вектора
Представление письма в виде вектора
![Page 8: diploma-prezentation](https://reader036.vdocuments.net/reader036/viewer/2022071907/55ca51e4bb61eb59138b4639/html5/thumbnails/8.jpg)
Многопрофильность
Добавление информации о пользователе
![Page 9: diploma-prezentation](https://reader036.vdocuments.net/reader036/viewer/2022071907/55ca51e4bb61eb59138b4639/html5/thumbnails/9.jpg)
dspam
СвободныйБыстрыйМногопользовательский
![Page 10: diploma-prezentation](https://reader036.vdocuments.net/reader036/viewer/2022071907/55ca51e4bb61eb59138b4639/html5/thumbnails/10.jpg)
Схема работы модифицированного dspam
![Page 11: diploma-prezentation](https://reader036.vdocuments.net/reader036/viewer/2022071907/55ca51e4bb61eb59138b4639/html5/thumbnails/11.jpg)
Результаты тестирования
Соотношение коэффицента верных обнаружений икоэффицента ложных срабатываний
![Page 12: diploma-prezentation](https://reader036.vdocuments.net/reader036/viewer/2022071907/55ca51e4bb61eb59138b4639/html5/thumbnails/12.jpg)
Результаты
Произведен обзор существующих средств фильтрацииспама, выбрано средство для доработки.В рамках средства реализован алгоритим фильтрацииспама на основе метода опорных векторов, описанный вработе Розинкина.Разработана модификация метода опорных вектров дляработы с несколькими профилями.Разработанный метод реализован в рамках системы dspam.Произведено экспериментальное исследование.