<div dir="ltr">Can only agree with Martin and Alex, there is no way around either splitting mails per recipient (very feasible), or som major rework of both the MailScanner and mailWatch code (very infeasible).<div>But I also have to agree that the increase in hardware seem quite excessive... i suppose you arrived at that figure by analysing the number of recipients per mail (and frequency of multi-recipient emails)? Well, the number isnät everything:-)</div>
<div>Provided you use the normal caching-dns-thingy and also use &quot;Cache SpamAssassin Results = yes&quot;, the actual processing time and resource use will be minimized (not to mention that the normal batch-processing style of MailScanner will ... help...:-).</div>
<div>Introducing a &quot;splitting MX&quot; between the internet and your regular MailScanner hosts should be rather simple, as well as adjusting which Received: lines your MailScanner hosts should ignore (since they otherwise will perceive all messages as originating from the &quot;splitting MX&quot; host)... So why not try that, with the gear you have ATM, and see where that leads you? Depending on what mailstore hosts you eventually deliver to, the storage impact should be minimal or even non-existant, since even M-Sexchange has abandioned &quot;single store&quot; since ... way back... so every recipient would eventually have their own copy in their own mailbox anyway;-).</div>
<div><br></div><div>As Alex says, we know nothing about your actual mail volume, but my money is on there being much less of a problem than you think, even if you do have ... serious traffic... (more than a few thousand mails/hour). the likeliest problem point/bottleneck is likely your MailWatch database so... keep an eye on that one, make sure you run it as InnoDB etc.</div>
<div><br></div><div>Cheers!</div><div>-- </div><div>-- Glenn</div></div><div class="gmail_extra"><br><br><div class="gmail_quote">On 11 July 2014 15:49, Martin Hepworth <span dir="ltr">&lt;<a href="mailto:maxsec@gmail.com" target="_blank">maxsec@gmail.com</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div>Might want to also consider having a more flexible approach as Alex had mentioned.<br></div>Will also help with some of the hardware requirements as you can also reject non-valid recipients at MTA as well as splitting the emails up, so the core MailScanner farm has less to do.<span class="HOEnZb"><font color="#888888"><br>

</font></span></div><div class="gmail_extra"><span class="HOEnZb"><font color="#888888"><br clear="all"><div>-- <br>Martin Hepworth, CISSP<br>Oxford, UK</div></font></span><div><div class="h5">
<br><br><div class="gmail_quote">On 11 July 2014 09:51, Sam Gelbart <span dir="ltr">&lt;<a href="mailto:samg@synaq.com" target="_blank">samg@synaq.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

Hi All,<br>
<br>
We at SYNAQ use and have used Mailscanner for many years. As an Email Hygiene provider MailScanner has served us very well.<br>
However, as we have grown (very rapidly in the past 6 months, to many more customer domains) we have noticed some deficiencies in MailScanner.<br>
<br>
Below is a brief description covering our problem areas:<br>
<br>
Overview<br>
The issue has arisen due to SYNAQ&#39;s ever growing client base and the fact that we&#39;re provisioning more and more customers (and email domains) on our hygiene platform, and that more than one of these customer recipients/domains (and their applicable rulesets) are being addressed in the same email.<br>


<br>
Problem 1<br>
1) <a href="http://abc.co.za" target="_blank">abc.co.za</a> and <a href="http://xyz.co.za" target="_blank">xyz.co.za</a> are both provisioned on our platform.<br>
2) <a href="http://abc.co.za" target="_blank">abc.co.za</a> has quarantining of SPAM configured, while <a href="http://xyz.co.za" target="_blank">xyz.co.za</a> does not.<br>
3) Mailscanner accepts the message for processing but &quot;chooses&quot; <a href="mailto:user@abc.co.za" target="_blank">user@abc.co.za</a> and <a href="http://abc.co.za" target="_blank">abc.co.za</a> as the Message&#39;s &quot;to_address&quot; and &quot;to_domain&quot;.<br>


4) MailScanner determines that the message is SPAM and because it has &quot;chosen&quot; @<a href="http://abc.co.za" target="_blank">abc.co.za</a> as the email domain it deletes the message as the configured spam action for @abc.coz.a is to delete.<br>


5) However the rule for <a href="http://xyz.co.za" target="_blank">xyz.co.za</a> is to store/quarantine spam. This does not happen because of the actions above and data is also never logged via MailWatch.<br>
6) The example above is a based on very simple scenario, and as you are aware this applies to many more complex rulesets (size, File Type etc) across the system.<br>
<br>
Problem 2<br>
1) <a href="http://abc.co.za" target="_blank">abc.co.za</a> and <a href="http://xyz.co.za" target="_blank">xyz.co.za</a> are both provisioned on our platform.<br>
2) A third party emails both <a href="mailto:user@abc.co.za" target="_blank">user@abc.co.za</a> and <a href="mailto:user@xyz.co.za" target="_blank">user@xyz.co.za</a> in a single email message.<br>
3) Mailscanner accepts the message for processing but &quot;chooses&quot; <a href="mailto:user@abc.co.za" target="_blank">user@abc.co.za</a> and <a href="http://abc.co.za" target="_blank">abc.co.za</a> as the Message&#39;s &quot;to_address&quot; and &quot;to_domain&quot;.<br>


4) When the message is processed, the MailWatch.pm script receives a message object for SQL logging with data only for <a href="mailto:user@abc.co.za" target="_blank">user@abc.co.za</a> and <a href="http://abc.co.za" target="_blank">abc.co.za</a>; <a href="http://xyz.co.za" target="_blank">xyz.co.za</a> is never logged.<br>


<br>
Finally we have considered splitting incoming messages by recipient at an MTA level to address this problem, but our calculations show that it would require 3.5x more hardware to process this increased mail load. So for us a MailsScanner solution is ideal.<br>


<br>
Based on the above, could you tell me if there is anything that can be done from a MailScanner community point of view to help develop MailScanner functionality to address these issues?<br>
We&#39;d be very happy to give a nice donation for a fix or patch.<br>
<br>
Also if the community has any ideas on other ways we can remedy this problem we welcome your feedback.<br>
<br>
Thanks and regards,<br>
<br>
Sam Gelbart<br>
SYNAQ<br>
<span><font color="#888888"><br>
<br>
--<br>
MailScanner mailing list<br>
<a href="mailto:mailscanner@lists.mailscanner.info" target="_blank">mailscanner@lists.mailscanner.info</a><br>
<a href="http://lists.mailscanner.info/mailman/listinfo/mailscanner" target="_blank">http://lists.mailscanner.info/mailman/listinfo/mailscanner</a><br>
<br>
Before posting, read <a href="http://wiki.mailscanner.info/posting" target="_blank">http://wiki.mailscanner.info/posting</a><br>
<br>
Support MailScanner development - buy the book off the website!<br>
</font></span></blockquote></div><br></div></div></div>
<br>--<br>
MailScanner mailing list<br>
<a href="mailto:mailscanner@lists.mailscanner.info">mailscanner@lists.mailscanner.info</a><br>
<a href="http://lists.mailscanner.info/mailman/listinfo/mailscanner" target="_blank">http://lists.mailscanner.info/mailman/listinfo/mailscanner</a><br>
<br>
Before posting, read <a href="http://wiki.mailscanner.info/posting" target="_blank">http://wiki.mailscanner.info/posting</a><br>
<br>
Support MailScanner development - buy the book off the website!<br>
<br></blockquote></div><br><br clear="all"><div><br></div>-- <br>-- Glenn<br>email: glenn &lt; dot &gt; steen &lt; at &gt; gmail &lt; dot &gt; com<br>work: glenn &lt; dot &gt; steen &lt; at &gt; ap1 &lt; dot &gt; se
</div>