<div>I think Greg is right on the money. Particularly at a place like IAS, where resources are good and users may be errant but are doing great things, I'd have a sequence of limits; first, a mail warning ("Your job PID 666 has consumed one million core hours, and its priority will be decremented in 500,000 CH unless you call the sysadmin at 555-1212") and later nice (iwith another email warning) and only then kill (with an email notificiation). If they have opportunities to upscale the allocations to really important jobs, and they are notified about automatic limitations ahead of time, they have no reason to complain.</div>

<div>Peter<br><br></div>
<div class="gmail_quote">On Thu, Oct 27, 2011 at 1:41 AM, Greg Lindahl <span dir="ltr"><<a href="mailto:lindahl@pbm.com">lindahl@pbm.com</a>></span> wrote:<br>
<blockquote style="BORDER-LEFT: #ccc 1px solid; MARGIN: 0px 0px 0px 0.8ex; PADDING-LEFT: 1ex" class="gmail_quote">
<div class="im">On Wed, Oct 26, 2011 at 05:14:13PM -0400, Steve Crusan wrote:<br><br>> If the issue is processes that run for far too long, and are abusing<br>> the system, cgroups or 'pushing' the users to use a batch system seems<br>
> to work better than writing scripts to make decisions on killing<br>> processes.<br><br></div>What I saw work well was nicing the process after a certain time,<br>including an email, and then killing and emailing after a longer<br>
time. The emails can push the batch alternative. Users generally don't<br>become angry if the limits are enforced by a script; they can only be<br>surprised once, and that first time is just nicing the process. If<br>
they have a hard time predicting runtime (a common issue, especially<br>for non-hardcore supercomputing types), it's not like they<br>_intentionally_ are exceeding the limits...<br><font color="#888888"><br>-- greg<br>
</font>
<div>
<div></div>
<div class="h5"><br><br>_______________________________________________<br>Beowulf mailing list, <a href="mailto:Beowulf@beowulf.org">Beowulf@beowulf.org</a> sponsored by Penguin Computing<br>To change your subscription (digest mode or unsubscribe) visit <a href="http://www.beowulf.org/mailman/listinfo/beowulf" target="_blank">http://www.beowulf.org/mailman/listinfo/beowulf</a><br>
</div></div></blockquote></div><br>