<div dir="ltr"><div>Prentice, I echo what Joe says.</div><div>When doing benchmarking with HPL or SPEC benchmarks, I would optimise the BIOS settings to the highest degree I could.</div><div>Switch off processor C) states</div><div>As Joe says you need to look at what the OS is runnign in the background. I would disable the Bright cluster manager daemon for instance.</div><div><br></div><div><br></div><div>85% of theoretical peak on an HPL run sounds reasonable to me and I would get fogures in that ballpark.</div><div><br></div><div>For your AMDs I would start by choosing one system, no interconnect to cloud the waters. See what you can get out of that.</div><div><br></div><div><br></div><div><br></div><div><br></div><div><br></div><div><br></div><div><br></div><div><br></div></div><div class="gmail_extra"><br><div class="gmail_quote">On 22 February 2018 at 15:45, Joe Landman <span dir="ltr"><<a href="mailto:joe.landman@gmail.com" target="_blank">joe.landman@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><span><br>
<br>
On 02/22/2018 09:37 AM, Prentice Bisbal wrote:<br>
<blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;padding-left:1ex;border-left-color:rgb(204,204,204);border-left-width:1px;border-left-style:solid">
Beowulfers,<br>
<br>
In your experience, how close does actual performance of your processors match up to their theoretical performance? I'm investigating a performances issue on some of my nodes. These are older systems using AMD Opteron 6274 processors. I found literature from AMD stating the theoretical performance of these processors is 282 GFLOPS, and my LINPACK performance isn't coming close to that (I get approximately ~33% of that).  The number I often hear mentioned is actual performance should be ~85%. of theoretical performance is that a realistic number your experience?<br>
</blockquote>
<br></span>
85% makes the assumption that you have the systems configured in an optimal manner, that the compiler doesn't do anything wonky, and that, to some degree, you isolate the OS portion of the workload off of most of the cores to reduce jitter.   Among other things.<br>
<br>
At Scalable, I'd regularly hit 60-90 % of theoretical max computing performance, with progressively more heroic tuning.   Storage, I'd typically hit 90-95% of theoretical max (good architectures almost always beat bad ones).  Networking, fairly similar, though tuning per use case mattered significantly.<span class="im HOEnZb"><br>
<br>
<blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;padding-left:1ex;border-left-color:rgb(204,204,204);border-left-width:1px;border-left-style:solid">
<br>
I don't want this to be a discussion of what could be wrong at this point, we will get to that in future posts, I assure you!<br>
<br>
</blockquote>
<br>
-- <br></span><span class="HOEnZb"><font color="#888888">
Joe Landman<br>
t: @hpcjoe<br>
w: <a href="https://scalability.org" target="_blank" rel="noreferrer">https://scalability.org</a></font></span><div class="HOEnZb"><div class="h5"><br>
<br>
______________________________<wbr>_________________<br>
Beowulf mailing list, <a href="mailto:Beowulf@beowulf.org" target="_blank">Beowulf@beowulf.org</a> sponsored by Penguin Computing<br>
To change your subscription (digest mode or unsubscribe) visit <a href="http://www.beowulf.org/mailman/listinfo/beowulf" target="_blank" rel="noreferrer">http://www.beowulf.org/mailman<wbr>/listinfo/beowulf</a><br>
</div></div></blockquote></div><br></div>