<div dir="ltr">simon, on most systems today there is no way to sync userlevel libs like mpi<div>with isa instructions in terms of atomicity. if you want perf. do it by hand:</div><div>i) separate them</div><div>ii) merge them with hand-crafted methods within threads</div><div><br></div><div>several order faster than mpi sequentializing...</div><div>mp</div><div><br><div class="gmail_extra"><br><div class="gmail_quote">2017-08-16 11:24 GMT+02:00 Simon Schwitanski <span dir="ltr"><<a href="mailto:simon.schwitanski@rwth-aachen.de" target="_blank">simon.schwitanski@rwth-aachen.de</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hello,<br>
<br>
I have got a question about the atomicity of accumulate operations as<br>
described in 11.7.1. It says (page 461, lines 8 - 11):<br>
<br>
> The previous correctness conditions imply that a location updated by a<br>
> call to an accumulate operation cannot be accessed by a load or an RMA<br>
> call other than accumulate until the accumulate operation has completed<br>
> (at the target).<br>
<br>
I am a little bit confused about what this actually means: Does it mean<br>
that local load accesses on the target are (somehow) delayed if there is<br>
an ongoing accumulate operation to the same location? Or does it just<br>
mean that concurrent load accesses are forbidden and lead to undefined<br>
behavior? And why does this not hold for store accesses?<br>
<br>
Thanks!<br>
<br>
<br>
Simon<br>
______________________________<wbr>_________________<br>
mpiwg-rma mailing list<br>
<a href="mailto:mpiwg-rma@lists.mpi-forum.org">mpiwg-rma@lists.mpi-forum.org</a><br>
<a href="https://lists.mpi-forum.org/mailman/listinfo/mpiwg-rma" rel="noreferrer" target="_blank">https://lists.mpi-forum.org/<wbr>mailman/listinfo/mpiwg-rma</a><br>
</blockquote></div><br></div></div></div>