Twiiterでご質問いただいたので、録画サーバーの状態監視について紹介します。
更改前はmuninを使ってた
更改前の録画サーバーはmuninというアプリケーションを使用していました。このアプリは設定すると、簡単にグラフ化してくれて便利に使用していました。
更改後のサーバーはPrometheusとGrafana
更改後の録画サーバーはPrometheusとGrafanaを使用しています。
更改当初はmuninやはてなが提供しているmackerelを使おうと考えていました。
muninだと変化がないし、mackerelは無料ユーザだと1日分のメトリクスしか参照できないため使用するのをやめました。
そこで、モダンな監視をしようということで、PrometheusとGrafanaを選びました。以下のリンクにあるプロダクトです。
概要としては、Prometheusがデータを溜め込んで、Grafanaで視覚化(グラフ化)してくれるというものです。
dockerで運用できて気軽に試せるし、イケてそうということで選びました。
ダッシュボード
Grafanaではグラフを表示するものをダッシュボードと呼びます。実際に自分が使用しているのはこんなダッシュボードです。
部屋の温度と湿度を左上に表示しています。この時は部屋の温度が13.3度、湿度が61%です。
それ以外はサーバーの状態を表示しています。
私が録画サーバーで主に見るのは以下です。それがパッと見えるようにしています。
- ディスク使用量
- ディスクの温度
- ビデオカードの温度
もちろん、これより詳細なダッシュボードもあって、サーバーのCPU使用率、メモリ使用率、ネットワークの状態を参照できます。また、dockerコンテナの状況だったり、ビデオカードの細かい情報も参照することができます。
ちなみに、ビデオカードの細かい状態を参照するダッシュボードが以下です。これはOpenAIのWhisperを動かした時の状態です。ゲームをやらない自分には、ビデオカードってこんなに動くんだと感動しました。
ちなみに、今っぽいこともあって、スマホやタブレットでも綺麗に見えるのもgoodです。私はディスプレイで参照するというより、iPadで表示させることが多いです。