<div dir="ltr">Normally I would suggest to do a diagnostic read dd from each disk, but you may not be able to do that with your RAID controller since it hides the individual disks.<div><br></div><div>My next recommendation would be a full AC cycle; can you power the host off for a few minutes? It's a bit cargo cult-y but sometimes it works. It may also help (or not) for you to spin around 3 times while the machine is off. </div></div><div class="gmail_extra"><br><div class="gmail_quote">On Mon, Mar 19, 2018 at 2:03 PM, David Mathog <span dir="ltr"><<a href="mailto:mathog@caltech.edu" target="_blank">mathog@caltech.edu</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><span class="">On 19-Mar-2018 13:58, David Mathog wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
The only oddness of late on "B" is that a few days ago it loaded too<br>
many memory hungry processes so the OS killed some.  I have had that<br>
happen before on other systems without them doing anything odd<br>
afterwards.<br>
</blockquote>
<br></span>
Sorry, hit return to soo.<br>
<br>
The /var/log/messages entries associated with that showed OOM only killed<br>
some user processes, no system processes were removed.<br>
<br>
Regards,<div class="HOEnZb"><div class="h5"><br>
<br>
David Mathog<br>
<a href="mailto:mathog@caltech.edu" target="_blank">mathog@caltech.edu</a><br>
Manager, Sequence Analysis Facility, Biology Division, Caltech<br>
______________________________<wbr>_________________<br>
Beowulf mailing list, <a href="mailto:Beowulf@beowulf.org" target="_blank">Beowulf@beowulf.org</a> sponsored by Penguin Computing<br>
To change your subscription (digest mode or unsubscribe) visit <a href="http://www.beowulf.org/mailman/listinfo/beowulf" rel="noreferrer" target="_blank">http://www.beowulf.org/mailman<wbr>/listinfo/beowulf</a><br>
</div></div></blockquote></div><br></div>