<div dir="ltr">On Mon, Apr 22, 2013 at 11:40 AM, Mark Hahn <span dir="ltr">&lt;<a href="mailto:hahn@mcmaster.ca" target="_blank">hahn@mcmaster.ca</a>&gt;</span> wrote:<br><div class="gmail_extra"><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div class="im"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
understood, but how did you decide that was actually a good thing?<br>
<br>
</blockquote>
Mark,<br>
<br>
Because it stopped the random out of memory conditions that we were having.<br>
</blockquote>
<br></div>
aha, so basically &quot;rebooting windows resolves my performance problems&quot; ;)</blockquote><div><br></div><div style>Not really.  We are saying &quot;we know better than you, flush your buffers&quot;.   Maybe in a perfect world we bring some kernel engineers in and make sure that the OOM killer and other memory subsystem controllers work as we desire when there is no swap.  That isn&#39;t something we have resources to do.  While we figured this out on our in-house white-box clusters, it is also needed on the more &quot;supported&quot; SGI ICE system.</div>
<div><br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="im"><br>
<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
I&#39;m guessing this may have been a much bigger deal on strongly NUMA<br>
machines of a certain era (high-memory ia64 SGI, older kernels).<br>
</blockquote></blockquote>
<br></div>
and the situation you&#39;re referring to was actually on Altix, right?<br>
(therefore not necessarily a good idea with current machines and kernels.)<br>
<br></blockquote><div><br></div><div style>No this is on two-socket, Intel x86_64 systems.  Standard cluster nodes running IB, Lustre, and RHEL6 (but we did the same thing in the past on RHEL5).</div><div style><br></div>
<div style>Craig </div></div><br></div></div>