前提
業務改善を目的としあるツールをshell script(bash)にて作成しました。
作成したのは半年前で、今まで問題等はありませんでした。
失敗した処理はフォルダ内のファイル名取得するだけの簡易な作りで、ファイル名もコマンドも固定です。
先週一度だけスクリプトのコマンド解析が失敗し、エラーとなる事象が発生したのですが
その時だけで今日にいたるまで再現していない状態です。
【失敗時の例】
入力:'ls /var/spool/log/hogehoge.log'
受付:'ls /var/spool/log/hog'
なお、ログイン時に以下メッセージが出力されており、調べたところCPUの温度が上昇することにより
出力されるメッセージでした。
CPU1:Package temperature above threshold,cpu clock throttled(total events =1)
CPU2:Package temperature above threshold,cpu clock throttled(total events =1)
実現したいこと
前提から原因はCPU温度上昇に関連しているのではと考えますが、そうだと断言できる材料がない状態です。
該当時間帯のcpu使用率をsarから確認しましたが、特に上昇していませんでした。
伺いたいのは以下になります。
① CPU温度の高騰が原因で本事象が発生することがあるのか(人に説明できる資料等のソースがあると助かります)
② 同じ事象が発生した場合に確認するべきこと(ログファイル、コマンド結果など)
以上となります。よろしくお願いします。