<html>
something else to add...<br><br>
According the script that Julian provided to run sa-learn through cron,
my log is called &quot;learn.spam.log&quot;<br><br>
When I checked that file - I added up all of the &quot;learned form
<i>XX</i> messages&quot; and the total number was 447.<br><br>
Is the &quot;learned from&quot; referring to spam and ham? Is it possible
that I have 87 spam and the rest of them a ham? I thought I was pretty
sure that more spam was getting processed than ham - but I could be
wrong.<br><br>
Can anyone shed a little light?<br><br>
Dene<br><br>
At 02:17 PM 5/6/2003 -0400, you wrote:<br>
<blockquote type=cite class=cite cite>The sa-learn -D --rebuild returned
the following output:<br><br>
&lt;---snip---&gt;<br>
<font size=2>debug: Score set 0 chosen. <br>
debug: running in taint mode? no <br>
debug: using &quot;/usr/share/spamassassin&quot; for default rules dir
<br>
debug: using &quot;/etc/mail/spamassassin&quot; for site rules dir <br>
Failed to create default user preference file
/root/.spamassassin/user_prefs <br>
debug: using &quot;/root/.spamassassin/user_prefs&quot; for user prefs
file <br>
debug: bayes: 17204 tie-ing to DB file R/O /root/.spamassassin/bayes_toks
<br>
debug: bayes: 17204 tie-ing to DB file R/O /root/.spamassassin/bayes_seen
<br>
debug: debug: Only 87 spam(s) in Bayes DB &lt; 200 <br>
debug: bayes: 17204 untie-ing <br>
debug: bayes: 17204 untie-ing db_toks <br>
debug: bayes: 17204 untie-ing db_seen <br>
debug: Score set 0 chosen. <br>
debug: Initialising learner <br>
debug: Initialising learner <br>
debug: lock: 17204 created <br>
/root/.spamassassin/bayes.lock.neo.datatechie.com.17204 <br>
debug: lock: 17204 trying to get lock on /root/.spamassassin/bayes with 0
<br>
retries <br>
debug: lock: 17204 link to /root/.spamassassin/bayes.lock: link ok <br>
debug: bayes: 17204 tie-ing to DB file R/W /root/.spamassassin/bayes_toks
<br>
debug: bayes: 17204 tie-ing to DB file R/W /root/.spamassassin/bayes_seen
<br>
debug: bayes: 17204 untie-ing <br>
debug: bayes: 17204 untie-ing db_toks <br>
debug: bayes: 17204 untie-ing db_seen <br>
debug: bayes: files locked, now unlocking lock <br>
debug: unlock: 17204 unlink /root/.spamassassin/bayes.lock <br>
debug: bayes: 17204 untie-ing <br>
</font>&lt;---snip---&gt;<br><br>
Does anything look wrong? I am shocked to find that only 87 messages have
been recorded so far, but that's what the output states.<br><br>
Thanks for the help.<br><br>
Dene<br><br>
At 11:38 AM 5/6/2003 -0400, you wrote:<br>
<blockquote type=cite class=cite cite><font face="arial" size=2 color="#0000FF">I
think you need 200 spam and 200 ham.&nbsp; Try running spamassassin with
the -D switch for debug and see what it says about bayes.&nbsp; Also, you
can run the check_bayes_db command and see how many spam and ham have
been learned.&nbsp; And you can run &quot;sa-learn -D --rebuild&quot; and
see if it says anything about there not being enough spam or ham.&nbsp;
These may give you some clues to your questions.</font><br>
&nbsp;<br>
<font face="arial" size=2 color="#0000FF">Jason</font>
<dl><font face="tahoma" size=2>
<dd>-----Original Message-----
<dd>From: Dene Ulmschneider
[<a href="mailto:dene@DATATECHIE.COM" eudora="autourl">mailto:dene@DATATECHIE.COM</a>]
<dd>Sent: Tuesday, May 06, 2003 10:53 AM
<dd>To: MAILSCANNER@JISCMAIL.AC.UK
<dd>Subject: Re: [MAILSCANNER] when is Bayes scoring used?<br><br>
</font>
<dd>Hey Julian et all-<br><br>

<dd>In regards to all of the messages I have read that Bayes will not
start working until the magic number of 200 messages is reached, I am
certain that I have processed more than 200 messages and yet I still see
no &quot;Bayes&quot; entries in the headers.<br><br>

<dd>I have checked the files in /root/.spamassassin and found the
following:<br><br>

<dd>filename<x-tab>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</x-tab><x-tab>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</x-tab>size<x-tab>&nbsp;&nbsp;&nbsp;&nbsp;</x-tab><x-tab>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</x-tab>date
modified
<dd>auto-whitelist<x-tab>&nbsp;&nbsp;</x-tab><x-tab>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</x-tab>644.0
kb<x-tab>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</x-tab>today
<dd>auto-whitelist.db<x-tab>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</x-tab>12.0
kb<x-tab>&nbsp;</x-tab><x-tab>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</x-tab>3.28.03
<dd>bayes_msgcount<x-tab>&nbsp;&nbsp;</x-tab>3.2
kb<x-tab>&nbsp;&nbsp;</x-tab><x-tab>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</x-tab>today
<dd>bayes_seen<x-tab>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</x-tab><x-tab>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</x-tab>1.3
mb<x-tab>&nbsp;&nbsp;</x-tab><x-tab>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</x-tab>today
<dd>bayes_seen.db<x-tab>&nbsp;&nbsp;&nbsp;</x-tab><x-tab>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</x-tab>4.0
kb<x-tab>&nbsp;&nbsp;</x-tab><x-tab>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</x-tab>3.28.03
<dd>bayes_toks<x-tab>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</x-tab><x-tab>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</x-tab>2.6
mb<x-tab>&nbsp;&nbsp;</x-tab><x-tab>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</x-tab>today
<dd>bayes_toks.db<x-tab>&nbsp;&nbsp;&nbsp;</x-tab><x-tab>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</x-tab>12.0
kb<x-tab>&nbsp;</x-tab><x-tab>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</x-tab>3.28.03<br><br>

<dd>while I was checking these files - I saw that a new file was created
and then deleted called auto-whitelist.lock, due to the fact that the
system starting processing mails at this time.<br><br>

<dd>The questions that I have are:
<dd>1-according to previous statements about the size of bayes_msgcount,
have I only correctly processed 3 or 4 emails?
<dd>2-why are all of the .db files form a month and a half ago?
<dd>3-why are there still no headers containing anything regarding
Bayes?
<dd>Am I missing something. I have had MailScanner running for about 2
months now and am certain that I have processed enough emails.<br><br>

<dd>Any help is appreciated.<br><br>

<dd>Thank You<br><br>

<dd>Dene Ulmschneider
<dd>Data Techie Inc.
<dd>-------------------------------------------------------------------------
<dd>office:<x-tab>&nbsp;</x-tab><x-tab>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</x-tab>718.738.8859
<dd>email:<x-tab>&nbsp;&nbsp;</x-tab><x-tab>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</x-tab>dene@datatechie.com
<dd>pager
mail:<x-tab>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</x-tab>denenow@datatechie.com
<dd>website:<x-tab>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</x-tab><a href="http://www.datatechie.com/" eudora="autourl">www.datatechie.com</a>
<dd>-------------------------------------------------------------------------
<dd>&quot;Life is too short...-...you&nbsp; should have dessert
first&quot;<br><br>

<dd>At 02:29 PM 5/6/2003 +0100, you
wrote:<blockquote type=cite class=cite cite>
<dd>At 14:18 06/05/2003, you
wrote:<blockquote type=cite class=cite cite>
<dd>Well i have just setup mailscanner 4.20-3 and i have some problemes
<dd>with bayes &quot;scoring&quot;.<br><br>

<dd>I have the bayes database working as it s modified each time i
receive
<dd>a mail but when i gor spam i never seen BAYES_DB tag in the scoring
of
<dd>spam.
<dd>Is there a minim size of the bayes database in order to be uzed for
<dd>scoring?</blockquote>
<dd>It won't start using the results of the Bayes data until 200 messages
have
<dd>been scanned. The bayes_msgcount file will tell you how many it has
scanned
<dd>(file size == number of messages).<br><br>
<br><br>
<br><br>
<blockquote type=cite class=cite cite>
<dd>Thanks in advance for any help<br><br>

<dd>P.S
<dd>the command
<dd>check_bayes_db -db /var/spool/spamassassin/bayes | head -8
<dd>0.000&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
0&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
0&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp; non-token data: db
format = on-the-fly
<dd>probs,
<dd>expiry, scan-counting
<dd>0.000&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
0&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
16&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp; non-token data:
nspam
<dd>0.000&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
0&nbsp;&nbsp;&nbsp;&nbsp; 1233&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
0&nbsp; non-token data: nham
<dd>0.000&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;
51394&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp; non-token data:
ntokens
<dd>0.000&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
0&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
0&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp; non-token data:
oldest age
<dd>0.000&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
0&nbsp;&nbsp;&nbsp;&nbsp; 1382&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
0&nbsp; non-token data: current scan-count
<dd>0.000&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
0&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
0&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp; non-token data: last
expiry scan-count
<dd>0.027&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
0&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
8&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 801&nbsp; english<br><br>
<br><br>
<br><br>

<dd>--
<dd>Eric Doutreleau
<dd>I.N.T&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
| Tel&nbsp;&nbsp; : +33 (0) 160764687
<dd>9 rue Charles Fourier&nbsp;&nbsp; | Fax&nbsp;&nbsp; : +33 (0)
160764321
<dd>91011 Evry&nbsp;&nbsp; France&nbsp;&nbsp;&nbsp;&nbsp; | email :
Eric.Doutreleau@int-evry.fr</blockquote>
<dd>--
<dd>Julian Field
<dd><a href="http://www.mailscanner.info/" eudora="autourl">www.MailScanner.info</a>
<dd>MailScanner thanks transtec Computers for their support
</dl></blockquote></blockquote></blockquote></html>