<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0" xml:base="http://webplanet.ru" xmlns:dc="http://purl.org/dc/elements/1.1/">
<channel>
 <title>Вебпланета - Тестирование различных методов блокировки спама - Comments</title>
 <link>http://webplanet.ru/news/testdrive/2004/2/12/spam_test.html</link>
 <description>Comments for &quot;Тестирование различных методов блокировки спама&quot;</description>
 <language>ru</language>
<item>
 <title>Re:</title>
 <link>http://webplanet.ru/forum/news.html%3Fnews%3D3190#comment-68141</link>
 <description>&lt;p&gt;Да все проще гораздо. Я же указал - в статистике не учитывались автоответы серверов. Т.е. в общей статистике - количестве писем - они есть, потому что я их не вычитал, но, если они распознавались как спам, то удалялись, соответственно. Хотя, строго говоря, спамом они не являются.&lt;br /&gt;
По разметке сомнительных - ну, сложно результаты Мэйла описывать. 52 письма - это то количество, которое осталось, после того как все нормальные письма я оттуда вытащил руками в отдельную папку. Я же писал, почему это происходило.&lt;br /&gt;
Антигона - так я и не спорю. Но смысл заключался в том, чтобы сравнить работу защиты на одинаковом потоке. В принципе, работа Мэйла была довольно похожа на работу Спамтеста, плюс антивирус.&lt;/p&gt;
&lt;p&gt;И последнее - все же это был немного &quot;для себя&quot; тест. Основными критериями были:&lt;br /&gt;
1. Максимально сократить объем спама.&lt;br /&gt;
2. Избавиться от вирусов.&lt;br /&gt;
3. Не потерять нужные письма.&lt;br /&gt;
Спамооборона сделала первое, второе и на 99% третье. Один процент может сыграть, а может и не сыграть. Мне, например, не пришло письмо с подтверждением регистрации в одном из каталогов. Некритично.&lt;/p&gt;
</description>
 <pubDate>Sat, 14 Feb 2004 11:25:08 +0300</pubDate>
 <dc:creator>Gray </dc:creator>
 <guid isPermaLink="false">comment 68141 at http://webplanet.ru</guid>
</item>
<item>
 <title>Ложные срабатывания</title>
 <link>http://webplanet.ru/forum/news.html%3Fnews%3D3190#comment-68140</link>
 <description>&lt;p&gt;Прошу прощения, из-за мелкого шрифта, похоже, обсчитался. действительно, должно быть не 833, а 899 &quot;хороших&quot; писем с Mail.ru.&lt;br /&gt;
Тогда действительно возникает зазор примерно в 30 писем у Спамообороны. Возможно, дело тут в том, что Грей не дал данных по разметке сомнительных писем - из текста неясно, куда они попадают в его статистике - в спам или в хорошие.&lt;br /&gt;
Короче говоря, нужна подробная таблица из десятка колонок, чтобы продолжать дискуссию.&lt;/p&gt;
</description>
 <pubDate>Sat, 14 Feb 2004 10:38:40 +0300</pubDate>
 <dc:creator>Гость</dc:creator>
 <guid isPermaLink="false">comment 68140 at http://webplanet.ru</guid>
</item>
<item>
 <title>Ложные срабатывания</title>
 <link>http://webplanet.ru/forum/news.html%3Fnews%3D3190#comment-68139</link>
 <description>&lt;p&gt;Не вижу тут никаких противоречий. Это теория множеств Вас путает.&lt;/p&gt;
&lt;p&gt;Вот, например: вы посчитали, что 833 письма хороших по данным Mail.ru. Из этого, заметим, не следует, что у Петренко (Грея) хороших писем было всего столько. Наверняка больше. Далее читаем статью: &quot;... «Спамооборона» пропустила без замечаний 933 письма. Из них оказалось спамом — 134 письма.&quot;&lt;br /&gt;
Значит, Спамооборона пропустила 799 хороших писем (933-134).&lt;br /&gt;
А сколько-то - приняла за спам и они в эти 799 не вошли. Если бы хороших во входном потоке всего было 833 и ни письмом больше, то количество ЛС у Спамообороны оказалось бы - 34 (=833-799). На самом деле хороших писем было больше, почему Грей и насчитал у Спамообороны 68 ложных срабатываний. Не вижу никаких противоречий.&lt;/p&gt;
&lt;p&gt;Читаем дальше: &quot;Спамтест пропустил без замечаний 986 писем, из которых спамом оказалось — 119 писем.&quot;.&lt;br /&gt;
Ну, тут хороших писем по данным Спамтеста - 847. Ну и в чём проблема? Противоречий пока не видно и никаких насчитанных Вами сотен ЛС - тоже.&lt;/p&gt;
&lt;p&gt;На самом деле, приведённых Греем цифр для полной картины недостаточно. Здесь мы имеем два исходных множества - истинно хорошие письма и истинно плохие (по версии хозяина ящика Грея), и восемь множеств разметки - хорошие/плохие по версии Спамобороны, хорошие/плохие/сомнительные по версии Спамтеста и хорошие/плохие/сомнительные по версии Mail.ru. Все они пересекаются друг с другом довольно причудливым образом. Чтобы точно уяснить картину, нужна довольно подробная табличка или двумерная картинка.&lt;/p&gt;
&lt;p&gt;Жаль, что Грей её не сделал. Но просмотреть глазами три потока по тысяче-полторы писем и учесть разметку фильтров - и так довольно большой труд. &lt;/p&gt;
&lt;p&gt;Мы сами делаем подобные расчёты постоянно и более подробно - но, увы, мы не независимая сторона.&lt;/p&gt;
</description>
 <pubDate>Sat, 14 Feb 2004 09:54:39 +0300</pubDate>
 <dc:creator>Ашманов</dc:creator>
 <guid isPermaLink="false">comment 68139 at http://webplanet.ru</guid>
</item>
<item>
 <title>Re:</title>
 <link>http://webplanet.ru/forum/news.html%3Fnews%3D3190#comment-68137</link>
 <description>&lt;p&gt;Тут кто-то что-то не понимает. (Возможно, это я, но разубедите).&lt;br /&gt;
Через Mail.Ru прошло 1023 письма, из них спамерских 124. Значит 899 писем Петренко признал не спамом, а желательной корреспонденцией и желательность этой корреспонденции не зависит от применяемых фильтров. Где оказались эти 899 _полезных_ писем после Спамобороны? Насколько я понимаю приведенные цифры, как минимум 100 из них должны были попасть в /dev/null ибо больше просто некуда. Причем это нижняя оценка числа ложных срабатываний, т. к. Mail.Ru тоже наверное что-то удалило зря.&lt;/p&gt;
&lt;p&gt;А цифра 3 - это ложные срабатывания отметки &quot;Probable Spam&quot;, их действительно немного.&lt;/p&gt;
</description>
 <pubDate>Fri, 13 Feb 2004 23:13:35 +0300</pubDate>
 <dc:creator>Горнал</dc:creator>
 <guid isPermaLink="false">comment 68137 at http://webplanet.ru</guid>
</item>
<item>
 <title>Ложные срабатывания</title>
 <link>http://webplanet.ru/forum/news.html%3Fnews%3D3190#comment-68132</link>
 <description>&lt;p&gt;Вы не так что-то считаете. Нет смысла складывать/вычитать данные от разных фильтров - там пересечение множеств может быть довольно кучерявым.&lt;/p&gt;
&lt;p&gt;Петренко же сам всё посчитал и прямо пишет, что Спамтест дал всего 3 ложных срабатывания (из них два - на спамерском рассыльщике Advanced Mail Sender, который маскируется под Outlook, а одно - из-за подозрительного оформления заголовка), а Спамооборона - 68, причём многие из этих писем - тоже сомнительные, &quot;технический шум&quot;.&lt;/p&gt;
&lt;p&gt;Таким образом, проценты ЛС такие - примерно 0,2% у Спамтеста, и 3% у Спамообороны. &lt;/p&gt;
&lt;p&gt;Соотношение понятное - базы Спамтеста поддерживает круглосуточная лингвистическая лаборатория, то есть живые люди, а Спамооборона - чисто автоматический сервис.&lt;/p&gt;
&lt;p&gt;Нужно ещё заметить, что фильтрация на пересылке откуда-то всегда работает хуже, чем на самом ящике (например, анализ IP может при пересылке страдать). Поэтому, скажем, Спамооборона в почте Яндекса может работать лучше, чем на пересылаемом потоке.&lt;/p&gt;
</description>
 <pubDate>Fri, 13 Feb 2004 17:57:09 +0300</pubDate>
 <dc:creator>Ашманов</dc:creator>
 <guid isPermaLink="false">comment 68132 at http://webplanet.ru</guid>
</item>
<item>
 <title>Re:</title>
 <link>http://webplanet.ru/forum/news.html%3Fnews%3D3190#comment-68128</link>
 <description>&lt;p&gt;&amp;gt;Из них «Спамооборона» пропустила без&lt;br /&gt;
&amp;gt;замечаний 933 письма. Из них оказалось&lt;br /&gt;
&amp;gt;спамом — 134 письма.&lt;/p&gt;
&lt;p&gt;Пропущенных нормальных писем 799.&lt;/p&gt;
&lt;p&gt;&amp;gt;«Спамтест» пропустил без замечаний 986&lt;br /&gt;
&amp;gt;писем, из которых спамом оказалось — 119&lt;br /&gt;
&amp;gt;писем. &lt;/p&gt;
&lt;p&gt;Пропущенных нормальных писем 867.&lt;/p&gt;
&lt;p&gt;&amp;gt;С Mail.Ru получилось все не очень здорово. &amp;gt;До ящика дошло 1023 письма. Из них спамом &amp;gt;оказалось 124. &lt;/p&gt;
&lt;p&gt;Пропущенных нормальных 899.&lt;/p&gt;
&lt;p&gt;Т. е. Спамоборона убила не меньше 100 (12% корреспонденции), а Спамтест не меньше 32 (4%)полезных писем? И это &quot;рабочее решение&quot;??&lt;/p&gt;
</description>
 <pubDate>Fri, 13 Feb 2004 14:16:48 +0300</pubDate>
 <dc:creator>Горнал</dc:creator>
 <guid isPermaLink="false">comment 68128 at http://webplanet.ru</guid>
</item>
<item>
 <title>спамфильтры</title>
 <link>http://webplanet.ru/forum/news.html%3Fnews%3D3190#comment-68121</link>
 <description>&lt;p&gt;Так Mail.ru и не предлагает себя в качестве &quot;фильтра от спама&quot;, он позиционируетсыя как полноценная почтовая служба, под это и заточен. А отключить одну опцию - не сложно, только вот нужно ли.&lt;/p&gt;
</description>
 <pubDate>Fri, 13 Feb 2004 11:48:11 +0300</pubDate>
 <dc:creator>Антигона</dc:creator>
 <guid isPermaLink="false">comment 68121 at http://webplanet.ru</guid>
</item>
<item>
 <title>Re:</title>
 <link>http://webplanet.ru/forum/news.html%3Fnews%3D3190#comment-68120</link>
 <description>&lt;p&gt;Да, действительно, когда все письма конторы стал прогонять через Спамоборону - некоторые нормальные письма не пролазили - поэтому перевез всё на спамтест - и доволен жизнью...&lt;/p&gt;
</description>
 <pubDate>Fri, 13 Feb 2004 06:50:15 +0300</pubDate>
 <dc:creator>Юрий</dc:creator>
 <guid isPermaLink="false">comment 68120 at http://webplanet.ru</guid>
</item>
<item>
 <title>Тестирование различных методов блокировки спама</title>
 <link>http://webplanet.ru/news/testdrive/2004/2/12/spam_test.html</link>
 <description>&lt;p&gt;Сергей Петренко, главный редактор проекта SearchEngines.Ru, тестирует различные методы блокировки спама. Для этого он  зарегистрировал аккаунты в Спамообороне «Яндекса», «Спамтесте» и на Mail.Ru.&lt;/p&gt;
&lt;p&gt;&lt;a href=&quot;http://webplanet.ru/news/testdrive/2004/2/12/spam_test.html&quot;&gt;Далее&lt;/a&gt;&lt;/p&gt;</description>
 <category domain="http://webplanet.ru/old">Архив</category>
 <comments>http://webplanet.ru/news/testdrive/2004/2/12/spam_test.html#comment</comments>
 <pubDate>Thu, 12 Feb 2004 14:33:55 +0300</pubDate>
 <dc:creator>admin</dc:creator>
 <guid isPermaLink="false">4408 at http://webplanet.ru</guid>
</item>
</channel>
</rss>
