Linux でメモリのパリティエラー

※ このエントリは、はてなグループ終了に伴う、サブブログからの引越エントリ(2011/02)です。
※ 情報が古い可能性もありますので、ご留意ください。



サーバが以下のエラーを残し OS ストール。

kernel: Uhhuh. NMI received for unknown reason b0.
kernel: You probably have a hardware problem with your RAM chips
kernel: Dazed and confused, but trying to continue

該当サーバには ECC メモリを積んでいたので、おそらく2つ以上のエラーが発生し、NMI (Non-maskable Interrupt) が検出したということか。

"trying to continue" と書いてあるが、実際は2分後くらいに Reboot してしまった。
とりあえず、メモリは交換して memtest 行きですな・・・。