На этом сайте вы сможете:
- узнать, какая программа нужна для решения ваших задач,
- скачать бесплатную (или условно-бесплатную) программу,
- научиться пользоваться скачанными полезными программами.
Навигатор
 
 
Статьи в тему
С Байесом наперевес
[16.12.2004 ]
Из всех существующих методов фильтрации спама применение теоремы Байеса выглядит наиболее привлекательным.

 
 

Электронная почта

В этом разделе представлены:

TheBat!

BayesIt!

Thunderbird



Пожалуй, сегодня не найти компьютерного пользователя, который бы не знал, что такое электронная почта. Всем известно, что электронная почта - это возможность практически мгновенной доставки письменного сообщения в любой конец света. Где-то стоят почтовые сервера, на которых интернет-пользователи заводят свои почтовые ящики. С помощью специальных программ, почтовых клиентов, пользователи обращаются к своим ящикам и проверяют, не пришло ли им очередное письмо. Или наоборот, отправляют собственные послания. Все, что нужно знать для обеспечения контакта - адрес E-mail.

Точно так же и точно по той же причине, как и в истории с браузерами, самым популярным почтовым клиентом стал Outlook Express компании Microsoft. Однако он далеко не идеален с точки зрения удобства, к тому же в его системе безопасности постоянно обнаруживаются очередные прорехи. Так что вполне имеет смысл опробовать альтернативные решения для работы с электронной почтой, описанные в этом разделе. Но прежде чем перейти к этим описаниям, я хотел бы сказать несколько слов о главной проблеме сегодняшнего дня, связанной с главным средством интернет-общения.

Реалии сегодняшнего дня таковы, что, начиная разговор об электронной почте, мы вынуждены говорить и о спаме - массовой рассылке невостребованных сообщений рекламного характера. Это явление в последнее время приобрело столь массовый и разрушительный характер, что пришла пора поставить спам в один ряд с вирусами. По оценкам экспертов в начале 2004 года ежедневно рассылается до 15 миллиардов (!) спам-писем. Более половины всех электронных писем уже являются спамом. Этот огромный паразитный трафик приводит к увеличению затрат каждого пользователя электронной почты, не говоря об индустрии в целом.

Кроме того, для каждого отдельно взятого человека спам становится источником постоянного раздражения. Интернет-пользователи вынуждены начинать свой рабочий день с уничтожения вороха ненужной рекламы, свалившейся в их ящики. И, как это часто бывает, чистка ящиков от спама приводит к удалению нужной корреспонденции, затерявшейся среди невостребованных писем.

Разумеется, интернет-сообщество не сидит, сложа руки, пытается бороться со свалившейся на его голову напастью. С этой целью изобретаются и постоянно совершенствуются все новые и новые средства фильтрации спама. И хотя пока что в этой борьбе побеждают спамеры, некоторые разработки уже серьезно им препятствуют. Так что, рано или поздно, спамеры не смогут доставлять свою корреспонденцию столь массово как сегодня, и их бизнес перестанет быть сверхприбыльным. Это - вопрос времени и желания отдельных пользователей всерьез оградить себя от получения невостребованной почты.

Как работают спам-фильтры? Есть множество подходов, в том числе:

  • Фильтрация почты по ключевым словам. Эффективность этого метода очень низка, поскольку требует больших затрат на создание и поддержание базы ключевых слов. Кроме того, спамеры постоянно изобретают новые и новые способы обойти подобные фильтры. Например, в русскоязычных письмах используется прием подмены русских букв латинскими, сходными по написанию (а, е, В, у и так далее).
  • Черные списки. Почтовые и IP-адреса, с которых рассылается спам, вносятся в черные списки и блокируются на уровне провайдеров или самим пользователем. И этот метод в силу ряда причин становится все менее эффективным, зато приводит к нарушению целостности Сети, когда вполне добропорядочные пользователи теряют возможность вести свою переписку.
  • Запрос на подтверждение. Прежде чем показать письмо получателю, генерируется запрос его отправителю: подтвердите, что вы действительно писали сообщение такому-то и такому-то. Если отправитель подтверждает факт написания письма, он признается "неспамером" и его адрес вносится в белый список. С этого момента почта от него к получателю проходит без проблем. Но этот метод фильтрации также не лишен очевидных недостатков. Во-первых, он доставляет массу неудобств "неспамерам"; во-вторых, многие спамеры уже вполне способны генерировать письма-подтверждения, что сводит на нет достоинства данного способа фильтрации, и приводит к еще большему увеличению паразитного трафика.
  • Статистическая фильтрация. Самыми перспективными, на сегодняшний день выглядят решения, основанные на статистической фильтрации входящей почты. В основу их работы положена теорема Байеса ( Bayes ), которая оценивает вероятность наступления какого-либо события исходя из статистики совершения этого же события в прошлом. Например, если пользователь встретил слово телемагазин в девяти спамерских посланиях и лишь в одном "чистом" письме, то у него появляется возможность оценить, с какой вероятностью следующее письмо, содержащее слово телемагазин , будет являться спамом.

Все разработчики современных почтовых клиентов встраивают в свои продукты различные спам-фильтры. Возможно, в течение пяти ближайших лет необходимость в этом и отпадет. А пока, рассказывая о почтовых клиентах, приходится подробно останавливаться на описании встроенных в них антиспамерских механизмов.



Поиск по сайту
SoftRing     Web

 
 
 
 
 
Карта сайта | Обратная связь

© 2004-2011 Soft Ring: интернет-энциклопедия полезных программ