<div dir="ltr"><div>Thanks for the info Josiah! Already restarted those runs, I don't think it should cause any harm.<br><br></div>-Tom<br></div><div class="gmail_extra"><br><br><div class="gmail_quote">On Tue, Dec 3, 2013 at 3:48 PM, Wm. Josiah Erikson <span dir="ltr"><<a href="mailto:wjerikson@hampshire.edu" target="_blank">wjerikson@hampshire.edu</a>></span> wrote:<br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">There was a loud bang from the roof (I think the A/C unit, but unsure), and then we had a voltage drop or spike or something, and even though everything is on UPS, a random smattering of cluster nodes on different UPSes rebooted. That obviously shouldn't happen - I guess maybe those UPSes aren't as awesome as they should be... but it's the ones that I thought were the good ones that "failed" in this situation. Anyway, Tom, that's why some of your runs crashed - you should be able to restart them safely.<span class="HOEnZb"><font color="#888888"><br>


<br>
-- <br>
Wm. Josiah Erikson<br>
Assistant Director of IT, Infrastructure Group<br>
System Administrator, School of CS<br>
Hampshire College<br>
Amherst, MA 01002<br>
<a href="tel:%28413%29%20559-6091" value="+14135596091" target="_blank">(413) 559-6091</a><br>
<br>
______________________________<u></u>_________________<br>
Clusterusers mailing list<br>
<a href="mailto:Clusterusers@lists.hampshire.edu" target="_blank">Clusterusers@lists.hampshire.<u></u>edu</a><br>
<a href="https://lists.hampshire.edu/mailman/listinfo/clusterusers" target="_blank">https://lists.hampshire.edu/<u></u>mailman/listinfo/clusterusers</a><br>
</font></span></blockquote></div><br></div>