<div dir="ltr">Hi Guys,<div><br></div><div>Sorry I wasn't able to attend.  I'm back from SC now, if you need me.</div><div><br></div><div>I have a concern about the current approach to revoking communicators.  Consider a program that uses a library with a communicator, CL, that is private to the library.  Process X makes a call to this library and performs a wildcard receive on CL.  Process Y fails; Y would have sent a message to X on CL.  Process Z sees that Y failed, but it sees it in the user code, outside of the library.  Process Z cannot call revoke on CL because it does not have any knowledge about how the library is implemented and it does not have a handle to CL.</div>
<div><br></div><div>This seems like a situation that will result in deadlock, unless the library is also extended to include a "respond to process failure" function.  Is this handled in some other way, and I'm just not seeing it?</div>
<div><br></div><div>It seems like the revoke(comm) approach requires the programmer to know about all communication and all communicators/windows in use in their entire application, including those contained within libraries.  Is that a correct assessment?</div>
<div><br></div><div> ~Jim.</div></div><div class="gmail_extra"><br><br><div class="gmail_quote">On Wed, Nov 20, 2013 at 2:39 PM, Aurélien Bouteiller <span dir="ltr"><<a href="mailto:bouteill@icl.utk.edu" target="_blank">bouteill@icl.utk.edu</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Rich, this is a followup of the proofreading work done during the regular meeting we had last week, and everybody, including SC attendees, had a chance to join. I am sorry you couldn’t.<br>

<br>
Anyway, here is the working document for today: all diffs since the introduction of the new RMA chapter 5 month ago.<br>
<br>
<br>
<br><br>
<br>
<br>
<br>
<br>
Le 19 nov. 2013 ŕ 17:07, Richard Graham <<a href="mailto:richardg@mellanox.com">richardg@mellanox.com</a>> a écrit :<br>
<br>
> With SC this week this is poor timing<br>
><br>
> Rich<br>
><br>
> ------Original Message------<br>
> From: Wesley Bland<br>
> To: MPI WG Fault Tolerance and Dynamic Process Control working Group<br>
> Cc: MPI WG Fault Tolerance and Dynamic Process Control working Group<br>
> ReplyTo: MPI WG Fault Tolerance and Dynamic Process Control working Group<br>
> Subject: Re: [mpiwg-ft] A meeting this week<br>
> Sent: Nov 19, 2013 2:13 PM<br>
><br>
> Ok. I'll be there. I'll send it off for an editing today.<br>
><br>
> Wesley<br>
><br>
>> On Nov 19, 2013, at 3:12 PM, Aurélien Bouteiller <<a href="mailto:bouteill@icl.utk.edu">bouteill@icl.utk.edu</a>> wrote:<br>
>><br>
>> Dear WG members,<br>
>><br>
>> We have been misreading the new forum rules. We have to buckle the text of the proposal this week and not in 2 weeks from now, so time is running short. I would like to invite you to a supplementary meeting tomorrow to make a review of the text together.<br>

>><br>
>> Jim, I don’t know if you will be able to attend on short notice, but your input would be greatly appreciated.<br>
>><br>
>> Date: Wed, November 20,<br>
>> Time: 3pm EDT/New York<br>
>> Dial-in information: <a href="tel:712-432-0360" value="+17124320360">712-432-0360</a><br>
>> Code: 623998#<br>
>><br>
>> Agenda:<br>
>> Review of ULFM text and final work.<br>
>><br>
>> Aurelien<br>
>><br>
>> --<br>
>> * Dr. Aurélien Bouteiller<br>
>> * Researcher at Innovative Computing Laboratory<br>
>> * University of Tennessee<br>
>> * 1122 Volunteer Boulevard, suite 309b<br>
>> * Knoxville, TN 37996<br>
>> * <a href="tel:865%20974%209375" value="+18659749375">865 974 9375</a><br>
>><br>
>><br>
>><br>
>><br>
>><br>
>><br>
>><br>
>> _______________________________________________<br>
>> mpiwg-ft mailing list<br>
>> <a href="mailto:mpiwg-ft@lists.mpi-forum.org">mpiwg-ft@lists.mpi-forum.org</a><br>
>> <a href="http://lists.mpi-forum.org/mailman/listinfo.cgi/mpiwg-ft" target="_blank">http://lists.mpi-forum.org/mailman/listinfo.cgi/mpiwg-ft</a><br>
> _______________________________________________<br>
> mpiwg-ft mailing list<br>
> <a href="mailto:mpiwg-ft@lists.mpi-forum.org">mpiwg-ft@lists.mpi-forum.org</a><br>
> <a href="http://lists.mpi-forum.org/mailman/listinfo.cgi/mpiwg-ft" target="_blank">http://lists.mpi-forum.org/mailman/listinfo.cgi/mpiwg-ft</a><br>
> _______________________________________________<br>
> mpiwg-ft mailing list<br>
> <a href="mailto:mpiwg-ft@lists.mpi-forum.org">mpiwg-ft@lists.mpi-forum.org</a><br>
> <a href="http://lists.mpi-forum.org/mailman/listinfo.cgi/mpiwg-ft" target="_blank">http://lists.mpi-forum.org/mailman/listinfo.cgi/mpiwg-ft</a><br>
<br>
--<br>
* Dr. Aurélien Bouteiller<br>
* Researcher at Innovative Computing Laboratory<br>
* University of Tennessee<br>
* 1122 Volunteer Boulevard, suite 309b<br>
* Knoxville, TN 37996<br>
* <a href="tel:865%20974%209375" value="+18659749375">865 974 9375</a><br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>_______________________________________________<br>
mpiwg-ft mailing list<br>
<a href="mailto:mpiwg-ft@lists.mpi-forum.org">mpiwg-ft@lists.mpi-forum.org</a><br>
<a href="http://lists.mpi-forum.org/mailman/listinfo.cgi/mpiwg-ft" target="_blank">http://lists.mpi-forum.org/mailman/listinfo.cgi/mpiwg-ft</a><br></blockquote></div><br></div>