工作 - 故障對應



チーム内の会議で、システム障害の対応について話しています。

小組會議中,正在談論系統故障。



【對話全文】

課長 :

急な招集ですみません。今朝8時ごろからシステムが応答しなくなったとの報告がありました。現在の状況を教えてください。

科長 :

臨時召集大家很抱歉。今天早上8點左右開始收到系統無回應的報告。請告訴我目前的狀況。

社員A :

はい。現在、本番サーバーのAPIがタイムアウトを起こしています。ログを確認したところ、DB接続数が上限に達していました。

職員A :

好的。現在生產環境的伺服器的API回應出現了逾時。檢查日誌後發現,資料庫連線數已達到了上限。

課長 :

DB接続上限? 昨日のリリースで設定を変更しましたよね。

科長 :

資料庫連線上限?昨天發佈時我們修改過設置,對吧?

社員A :

はい、最大接続数を100から200に増やしたのですが、バッチ処理が重なった時間帯に急増したようです。

職員A :

是的,將最大連接數從100提高到了200,但似乎在批次重疊的時段連接數急劇增加了。

課長 :

再発防止のために、バッチ処理のスケジュールをずらす必要がありそうですね。

科長 :

為了防止再次發生,看起來需要調整批次的執行時間。

社員A :

とりあえず一時的にアプリケーションを再起動し、接続をリセットしました。今は復旧しています。

職員A :

目前暫時重啟了程序,重置了連線。現在已經恢復正常了。

課長 :

ありがとうございます。原因は設定ミスではなく、想定外の負荷という認識でよろしいですか?

科長 :

謝謝。問題原因不是設定錯誤,而是意料之外的負載,對嗎?

社員A :

はい。アクセス数が通常の3倍近くになっていたため、負荷試験の条件を見直す必要があると思います。

職員A :

是的。訪問量比平常增加了近3倍,我認為需要重新審視負載測試的條件。

課長 :

了解しました。では、一次報告として原因と対応内容をまとめ、クライアントには私から連絡します。

科長 :

了解了。那就作為一次報告,把原因和應對措施整理一下,我會聯絡客戶。

社員B :

報告書のフォーマットはいつもの「障害対応報告書」でよろしいですか?

職員B :

報告的格式還是用平常的「故障處理報告書」嗎?

課長 :

はい、それでお願いします。明日午前までに提出してください。

科長 :

是的,請用那個格式。明天上午之前提交。

社員B :

承知致しました。再発防止策も併せて記載致します。

職員B :

明白了。我會連同再發防止措施一起寫進去。

課長 :

助かります。今回の件は軽微ですが、今後のために検証環境でも再現テストをお願いします。

科長 :

謝謝。這次問題不嚴重,但為了防止日後再發生,請在測試環境中也進行重現測試。

社員A :

了解しました。本番への影響は完全に解消しています。

職員A :

明白。本番環境的影響已完全解決。

課長 :

ありがとうございます。では、今回の障害対応はこれで一区切りとしましょう。お疲れさまでした。

科長 :

謝謝。那麼這次的故障處理就先到這裡。辛苦大家了。