Это не спам: ham и ложные срабатывания

Это не спам: ham и ложные срабатывания

Всем нравятся обстоятельные комментарии. Читатели могут ознакомиться с дополнительной информацией, поучаствовать в интересных дискуссиях, а авторы – помочь пользователям найти верные ответы на поставленные вопросы. Однако вы не должны пропускать спам. Akismet и другие антиспам-плагины превосходно справляются с этой задачей, но как и любые другие автоматические решения, они не совершенны: иногда можно столкнуться с тем, что легитимный комментарий помечается как спам, и наоборот. Спасение “живых” комментариев из кучи спама позволяет поддержать активные обсуждения, а также поднять качество и репутацию вашего сайта. В этой статье мы посмотрим, каким образом связка WordPress & Akismet определяет, что считать за спам, обсудим популярные антиспам-стратегии и посмотрим на некоторые приемы, позволяющие бороться со спамом.

В WordPress существует три типа ответов: комментарии, уведомления и обратные ссылки. Также у каждого ответа есть свой статус:

  • approved – одобрен
  • spammed – помечен как спам
  • moderated – ожидает проверки
  • in the trash – отправлен в корзину

Вы никогда не пропустите одобренные комментарии и комментарии, ожидающие модерации – в корзину они просто так не попадут. А вот с комментариями, помеченными как спам, все гораздо сложнее. Такие комментарии вполне себе могут оказаться легитимными (в терминах Akismet они называются ham). Это сложно выяснить, поскольку в последнее время количество спама неуклонно растет.

WordPress не считает ответы за спам, если они не содержат фраз, добавленных во встроенный черный список. Соответственно, любые комментарии, содержащие запрещенное слово или фразу, будут незамедлительно помечены как спам. Чтобы оградить себя от ненужного спама, необходимо задавать такие ключи для черного списка, которые никак не пересекаются с вашим сайтом: например, “baby uggs”.

Справиться со спамом можно и самостоятельно, однако Akismet и другие плагины позволяют сделать это в автоматическом режиме, причем с более высокой точностью. Правда, статистика защиты от спама иной раз выдает какие-то запредельные значения. Ниже приведена статистика для ложных срабатываний по месяцам:

Число ложных срабатываний зависит от нас, пользователей. Нужно регулярно проверять спам на наличие легитимных комментариев, иначе можно лишиться какого-то процента ответов. Конечно, сделать это подчас затруднительно, поскольку спам валит со всех сторон:

Теперь давайте посмотрим на то, как выяснить, является ли комментарий спамом или нет.

  • Текст комментария – легитимные комментарии обычно резко выделяются на фоне остального барахла.
  • Граватары – обычно являются сигналом качества, однако в последнее время спамеры тоже стали использовать их.
  • Текст ссылки – в спамерских комментариях текст ссылки обычно содержит в себе ключевые слова: например, “Baby Ugg Boots”
  • URL сайта – что-то большее, чем домен или подкаталог первого уровня, обычно является спамом.
  • Насыщенность ссылками – легитимные комментарии редко содержат в себе более одной-двух ссылок.

На скриншоте проиллюстрированы основные аспекты спама:

Комментарии с граватарами, действительно, выделяются в общем списке, однако не являются ham’ом.

http://digwp.com/2011/10/ham-hunter/

Сохранено из oddstyle.ru

Добавить комментарий

%d такие блоггеры, как: