<div dir="ltr">Hi Pavan,<div><br></div><div>I believe this is adequately specified on pg 436, line 37.  P1 will *eventually* see the new value for "a" without any additional synchronization operations, but neither the flush by P0 nor the Recv by P1 guarantee that P1 will see the new value immediately.</div>
<div><br></div><div style> ~Jim.</div></div><div class="gmail_extra"><br><br><div class="gmail_quote">On Sat, Jul 27, 2013 at 1:08 PM, Pavan Balaji <span dir="ltr"><<a href="mailto:balaji@mcs.anl.gov" target="_blank">balaji@mcs.anl.gov</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Dear all,<br>
<br>
We had some discussion on the semantics of UNIFIED in the past, that<br>
we were hoping to have clarified in MPI-3.1 or the errata.  This email<br>
is to revive that discussion, so that we don't forget to address it.<br>
<br>
Specifically, the concern was that some members of the WG believed<br>
that in the UNIFIED model, data is usable by the remote process after<br>
a PUT without an additional WIN_SYNC, while some members believed that<br>
it is not.  Here's the example in question:<br>
<br>
P0:<br>
Win_lock_all<br>
Put(a, P1)<br>
Flush<br>
MPI_Send(P1)<br>
<br>
P1:<br>
Win_lock_all<br>
MPI_Recv(P0)<br>
read a<br>
<br>
The question was whether the above program was valid without a<br>
WIN_SYNC on P1 between the Recv(P0) and "read a".  If we want this to<br>
be valid in the UNIFIED model, only x86-like architectures can provide<br>
UNIFIED efficiently.  Other architectures, such as PPC or ARM, that<br>
require an additional read barrier on P1 will not be able to provide<br>
UNIFIED even if they are cache-coherent, unless they add a memory barrier in every other MPI call (e.g., MPI_Recv in this case).<br>
<br>
One possible solution we discussed was to clarify that this is not<br>
allowed in UNIFIED, but provide a third memory model called<br>
UBER_SUPER_UNIFIED, that will allow this.  (or say that it is allowed<br>
in UNIFIED and provide a third model called KIND_OF_UNIFIED, which is<br>
in between UNIFIED and SEPARATE).<br>
<br>
Other solutions are welcome.<br>
<br>
Irrespective of when we make the change of possibly adding an<br>
additional memory model (MPI-3.1, MPI-4, whatever), we should clarify<br>
the standard on what is allowed in MPI-3 and what is not, as an errata<br>
item.  Without that, it's confusing for implementors.<span class="HOEnZb"><font color="#888888"><br>
<br>
 -- Pavan<br>
<br>
-- <br>
Pavan Balaji<br>
<a href="http://www.mcs.anl.gov/~balaji" target="_blank">http://www.mcs.anl.gov/~balaji</a><br>
______________________________<u></u>_________________<br>
mpi3-rma mailing list<br>
<a href="mailto:mpi3-rma@lists.mpi-forum.org" target="_blank">mpi3-rma@lists.mpi-forum.org</a><br>
<a href="http://lists.mpi-forum.org/mailman/listinfo.cgi/mpi3-rma" target="_blank">http://lists.mpi-forum.org/<u></u>mailman/listinfo.cgi/mpi3-rma</a><br>
</font></span></blockquote></div><br></div>