Алгоритм работы компонента
Работа компонента Анти-Спам разбита на два
этапа:
- Сначала Анти-Спам применяет к сообщению
жесткие критерии фильтрации. Эти критерии позволяют быстро
определить, является сообщение спамом или нет. Анти-Спам
присваивает сообщению статус спам или не
спам, проверка останавливается, и сообщение передается для
обработки почтовому клиенту (см. ниже шаги 1 – 5).
- На следующих шагах работы алгоритма (см.
ниже шаги 6 – 10) Анти-Спам изучает почтовые сообщения,
прошедшие четкие критерии отбора предыдущих шагов. Такие сообщения
уже нельзя однозначно расценивать как спам. Поэтому Анти-Спаму
приходится вычислять вероятность
того, что сообщение является спамом.
Рассмотрим подробнее алгоритм работы
Анти-Спама:
- Адрес отправителя почтового сообщения
проверяется на присутствие в списках разрешенных и запрещенных
отправителей:
- Если сообщение было отправлено с помощью
Microsoft Exchange Server, и проверка таких сообщений отключена, то
сообщению присваивается статус не
спам.
- Сообщение анализируется на наличие строк из
списка разрешенных фраз.
Если найдена хотя бы одна строка из этого списка, сообщению
присваивается статус не
спам.
- Сообщение анализируется на наличие строк из
списка запрещенных фраз.
Обнаружение в сообщении слов из этого списка увеличивает
вероятность того, что сообщение является спамом. Когда вычисленная
вероятность превышает 100%, сообщению присваивается статус
спам.
- Если текст сообщения содержит адрес,
входящий в базу подозрительных и фишинговых веб-адресов, письму
присваивается статус спам.
- Производится анализ почтового сообщения с
помощью технологии PDB. При этом Анти-Спам сравнивает заголовки
почтовых сообщений с образцами заголовков спам-сообщений. Каждое
совпадение увеличивает вероятность того, что сообщение является
спамом.
- Производится анализ почтового сообщения с
помощью технологии GSG. При этом Анти-Спам анализирует изображения
в составе почтового сообщения. Если в изображениях, вложенных в
сообщение, найдены признаки, характерные для спама, вероятность
того, что сообщение является спамом, увеличивается.
- Почтовое сообщение анализируется с помощью
технологии Recent Terms. При этом Анти-Спам ищет в тексте сообщения
фразы, характерные для спама. Эти фразы содержатся в обновляемых
базах Анти-Спама. По окончании анализа Анти-Спам вычисляет,
насколько увеличилась вероятность того, что сообщение является
спамом.
- Проверяется наличие дополнительных признаков,
характерных для спама. Обнаружение каждого признака увеличивает
вероятность того, что проверяемое сообщение является спамом.
- Если было произведено обучение Анти-Спама,
то сообщение проверяется с помощью технологии iBayes.
Самообучающийся алгоритм iBayes подсчитывает вероятность того, что
сообщение представляет собой спам, на основе частоты появления в
тексте сообщения фраз, характерных для спама.
Результатом анализа сообщения является
вероятность того, что
почтовое сообщение является спамом. Создатели спама постоянно
совершенствуют его маскировку, поэтому чаще всего вычисленная
вероятность не достигает 100%. Для успешной фильтрации потока
почтовых сообщений Анти-Спам использует два параметра:
- Фактор
спама – значение вероятности, при превышении которой
сообщение считается спамом. Если вероятность меньше данного
значения, то Анти-Спам присваивает сообщению статус потенциальный спам.
- Фактор
потенциального спама – значение вероятности, при
превышении которой сообщение считается потенциальным спамом. Если
вероятность меньше данного значения, то Анти-Спам расценивает
сообщение как полезное.
В зависимости от заданных значений факторов
спама и потенциального спама сообщения получают статус спам или потенциальный спам. Также сообщения
получают метку [!! SPAM] или
[!! Probable Spam] в поле
Тема согласно присвоенному
статусу. Затем они обрабатываются по правилам, которые вы задали для
вашего почтового клиента.
|