<meta http-equiv="Content-Type" content="text/html; charset=utf-8"><meta name="ProgId" content="Word.Document"><meta name="Generator" content="Microsoft Word 11"><meta name="Originator" content="Microsoft Word 11"><link rel="File-List" href="file:///C:%5CDOCUME%7E1%5CMUHAMMAD%5CLOCALS%7E1%5CTemp%5Cmsohtml1%5C01%5Cclip_filelist.xml"><style>
<!--
 /* Style Definitions */
 p.MsoNormal, li.MsoNormal, div.MsoNormal
        {mso-style-parent:"";
        margin:0in;
        margin-bottom:.0001pt;
        mso-pagination:widow-orphan;
        font-size:12.0pt;
        font-family:"Times New Roman";
        mso-fareast-font-family:"Times New Roman";}
@page Section1
        {size:8.5in 11.0in;
        margin:1.0in 1.25in 1.0in 1.25in;
        mso-header-margin:.5in;
        mso-footer-margin:.5in;
        mso-paper-source:0;}
div.Section1
        {page:Section1;}
-->
</style>

<p class="MsoNormal" style="">Hi,<br>
perhaps I could not better ask my question.<br>
<br>
My question is that if we do not have free cpu cores in a PC or cluster (all
cores are running MPI processes), still the auto-vertorization is beneficial?
Or it is beneficial only if we have some free cpu cores locally? <br>
<br>
thanks</p>

<br><br><div class="gmail_quote">On Mon, Nov 30, 2009 at 5:50 PM, David N. Lombard <span dir="ltr"><<a href="mailto:dnlombar@ichips.intel.com">dnlombar@ichips.intel.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<div><div></div><div class="h5">On Mon, Nov 30, 2009 at 01:24:34PM -0700, amjad ali wrote:<br>
> Hi,<br>
> Suppose we run a parallel MPI code with 64 processes on a cluster, say of 16 nodes. The cluster nodes has multicore CPU say 4 cores on each node.<br>
><br>
> Now all the 64 cores on the cluster running a process. Program is SPMD, means all processes has the same workload.<br>
><br>
> Now if we had done auto-vectorization while compiling the code (for example with Intel compilers); Will there be any benefit (efficiency/scalability improvement) of having code with the auto-vectorization? Or we will get the same performance as without Auto-vectorization in this example case?<br>

><br>
> How can we really get benefit in performance improvement with Auto-Vectorization?<br>
<br>
</div></div>Vectorization takes advantage of the processor's vector instructions to increase data-level parallelism.<br>
How much that benefits your code depends very much on your code; you would need to recompile your code and test.<br>
<font color="#888888"><br>
--<br>
David N. Lombard, Intel, Irvine, CA<br>
I do not speak for Intel Corporation; all comments are strictly my own.<br>
</font></blockquote></div><br>