Zabbixで3か月の温度推移調査(Linux自作PC)
以前構築したマイニングおよびディープラーニング用のLinux自作PCですが、最近の気温の上昇に伴ってか、Logwatchのデイリーレポートの温度が上昇しているように見えます。 本記事ではZabbixを用いて3か月間の運用における温度や負荷を詳細に調査し、冷却対策などが必要かどうか検討します。
全 12 件中 1〜10 件を表示
以前構築したマイニングおよびディープラーニング用のLinux自作PCですが、最近の気温の上昇に伴ってか、Logwatchのデイリーレポートの温度が上昇しているように見えます。 本記事ではZabbixを用いて3か月間の運用における温度や負荷を詳細に調査し、冷却対策などが必要かどうか検討します。
これまでにClamAVのフルスキャンの負荷対策と設定修正を行ってきました。 今回は、週に1度の定期スキャンが正しく行われたか検証します。
ディープラーニングおよびマイニング用に運用しているマシンで定期実行しているClamAVですが、過去に2回ほど高負荷問題へ対処しています。それにも関わらず昨日再度問題が発生したため、また問題へ対処することにします。
ディープラーニング・マイニング用マシンで稼働中に再度発生した高負荷問題への対処を行っていきます。 [以前](/posts/2017/12/25-high-load2)に対処したClamAVのスキャン時の問題ですが、再び定期スキャンにおいて同様に高負荷問題が発生しました。本記事ではこの問題に再度対処していきます。 環境は以前と同様、Debian Stretch 9.3.0になります。
ディープラーニング・マイニング用マシンで稼働中に発生した高負荷問題への対処を行っていきます。 [前回](/posts/2017/12/25-high-load1)で高負荷の状況をZabbixの監視結果により確認しました。問題がCPU利用率にあることが分かったので、対処していきます。対象環境はGeforce 1070を設定したDebian 9.3となります。
本日早朝にSlackに投稿させてるZabbixのアラートが38件近くに達しました。 何事かと思って確認したところ、CPU温度が60度前後を往復し、WarningとRecoverを繰り返し送信しており、 さらにはbusy process, busy poller process数が300で多すぎるとか言われて、 CPUのio waitも55%となっていました。
Debian Stretch 9.3.0で[以前](/posts/2017/12/19-temp-observe5)に行ったZabbixの温度監視設定を修正します。 まとめて複数コアを監視するのではなく、個別監視とします。
Debian Stretch 9.3で稼働するZabbixで、Slackによる通知を行えるように設定を行います。 [前回](/posts/2017/12/19-temp-observe5)でCPUとGPUの温度監視に関するZabbixの設定を行いました。本記事ではメール通知以外にも即応性を優先してSlackでも同時に通知を行えるようにします。
ディープラーニング・マイニングで常時稼働するマシン(Debian Stretch 9.3)の温度監視をZabbixで行います。 [前回](/posts/2017/12/18-temp-observe4)でZabbixの導入を行いました。本記事ではZabbixの設定を行います。
Debian Stretch 9.3でZabbixを導入し、ディープラーニング・マイニングで常時稼働するマシンの監視を行います。 [前回](/posts/2017/12/17-temp-observe3)でnginxにphpの導入を行いました。本記事ではZabbixの導入を行います。
スポンサーリンク