Морфологические словари

На вкладке Морфологические словари создаются правила для проведения морфологического анализа сайтов. Если в тексте анализируемого сайта содержится достаточное для блокировки количество предварительно заданных слов и словосочетаний, доступ к ресурсу блокируется.

Опция Морфологический анализ включается в левом верхнем углу вкладки Морфологические словари:

При этом морфологический анализ проводится только с использованием включенных словарей. Если ни один словарь не включен, морфологический анализ не проводится.

Проверка морфологическими словарями распространяется на весь расшифрованный трафик, поэтому для работы морфологического анализа необходимо создать в Контент-фильтре правило расшифровки трафика.

По умолчанию в таблицу добавлены четыре словаря, которые нельзя отредактировать или удалить:

  • Словарь наркотических средств;

  • Словарь порнографии;

  • Словарь матерных слов;

  • Словарь терроризм.

По умолчанию предустановленные словари отключены.

Для создания морфологического словаря выполните действия:

1. Перейдите в раздел Правила трафика -> Контент-фильтр -> Морфологические словари и нажмите Добавить.

2. На вкладке Описание введите название словаря и комментарий:

3. На вкладке Слова добавьте слова для блокировки трафика вручную или загрузите из файла:

При добавлении слов вручную:

  • Введите значение в поле Пороговый вес.

Пороговый вес - общий вес указанных в настройках словаря слов (целое число от 0 до 2 147 483 648). Если при проверке сайта общий вес найденных на нем слов превысит пороговый, доступ к сайту будет заблокирован.

  • Нажмите Добавить слова.

  • Заполните поля Слово/словосочетание и Вес при добавлении каждого слова:

При загрузке слов из файла нажмите Добавить из файла и выберите загружаемый файл. В один словарь можно загружать несколько файлов. В этом случае дублирующиеся слова будут удалены, останется только одно вхождение с установленным весом. Значение в поле Пороговый вес указывается автоматически.

Требования к загрузке из файла:

  • Формат файла - CSV, кодировка - UTF-8;

  • В одной строке должно быть одно слово или словосочетание и вес, разделенные точкой с запятой:

Пример
слово;20
словосочетание;20

Если вес слов не указан, по умолчанию применяется значение 20. В случае неудачной загрузки файла появится окно с уведомлением Файл не соответствует требованиям.

При Пороговом значении = 100 доступ к сайту будет заблокирован, если на сайте 5 и более раз упоминается "слово" и/или "словосочетание".

4. Для сохранения настроек нажмите Добавить словарь.

Результат морфологического анализа представлен в разделе Отчеты и журналы -> Журнал веб-доступа. В журнале также отображаются дата и время, причина запрета, название правила, название морфологического словаря, IP источника и имя пользователя:

Last updated