<div dir="ltr">Concur!  Porting code to BGL was more or less trivial.  &quot;porting&quot; to CUDA means basically re-imagining how to parallelize your code. </div><div class="gmail_extra"><br><br><div class="gmail_quote">
On Thu, Apr 4, 2013 at 8:22 AM, Prentice Bisbal <span dir="ltr">&lt;<a href="mailto:prentice.bisbal@rutgers.edu" target="_blank">prentice.bisbal@rutgers.edu</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div class="im">On 04/03/2013 11:42 AM, Geoffrey Jacobs wrote:<br>
&gt; On 04/03/2013 08:27 AM, Bret Stouder wrote:<br>
&gt;&gt; Prentice:<br>
&gt;&gt;<br>
&gt;&gt; For the money you could buy a lot more real computational cycles that last a lot longer than anything proprietary from IBM.  The reason the Origins have been out of production for a long time is the result of research moving to a commodity server platform.  Taken a look at what Cray offers lately?  Looks a lot like commodity.  If you are going to take the time to port code, it seems that a reasonable argument could be made to stay away from Blue Gene and port to Cuda or Phi.<br>

&gt;&gt;<br>
&gt;&gt; Bret<br>
<br>
</div>Actually, that&#39;s a naive argument. The Blue Gene architecture uses<br>
standard MPI and support C, C++, Fortran, and Python, so any MPI<br>
compliant program written in any of those languages, which will also run<br>
just fine on a Blue Gene, with no porting necessary - just compile the<br>
code for the BG processors using GCC or the IBM XL compilers. IBM<br>
provides the ESSL and MASSV libaries that are optimized for the Blue<br>
Gene, but those are specified at link time, so I wouldn&#39;t really call<br>
that porting. Sure, there are tweaks you could use to really optimize<br>
your code for BG, but just doing the above will get you very far.<br>
<br>
In contrast, Cuda requires adding Cuda specific code to move data into<br>
and out of the device, and the sections to be run on the cuda processors<br>
needs to be rewritten in terms of cuda thread index, etc.<br>
<br>
For a large code, this could take a significant amount of labor, enough<br>
that it&#39;s conceivable in certain cases buying a Blue Gene could be<br>
quicker and more cost-effective than spending all the money on the labor<br>
to port your code to Cuda, test, optimize, test...<br>
<br>
In short, it&#39;s a lot more effort to port MPI-compliant code for Cuda<br>
than for a Blue Gene.<br>
<br>
I specifically didn&#39;t mention Phi because I do not know the details of<br>
porting/optimizing code for Phi.<br>
<span class="HOEnZb"><font color="#888888"><br>
Prentice<br>
</font></span><div class="HOEnZb"><div class="h5"><br>
_______________________________________________<br>
Beowulf mailing list, <a href="mailto:Beowulf@beowulf.org">Beowulf@beowulf.org</a> sponsored by Penguin Computing<br>
To change your subscription (digest mode or unsubscribe) visit <a href="http://www.beowulf.org/mailman/listinfo/beowulf" target="_blank">http://www.beowulf.org/mailman/listinfo/beowulf</a><br>
</div></div></blockquote></div><br><br clear="all"><div><br></div>-- <br>- - - - - - -   - - - - - - -   - - - - - - - <br>Nathan Moore<br>Winona, MN<div>- - - - - - -   - - - - - - -   - - - - - - -</div><div>- - - - - - -   - - - - - - -   - - - - - - -</div>

</div>