チーム内の会議で、システム障害の対応について話しています。
小組會議中,正在談論系統故障。
【對話全文】
課長 :
急な招集ですみません。今朝8時ごろからシステムが応答しなくなったとの報告がありました。現在の状況を教えてください。![]()
科長 :
臨時召集大家很抱歉。今天早上8點左右開始收到系統無回應的報告。請告訴我目前的狀況。
社員A :
はい。現在、本番サーバーのAPIがタイムアウトを起こしています。ログを確認したところ、DB接続数が上限に達していました。![]()
職員A :
好的。現在生產環境的伺服器的API回應出現了逾時。檢查日誌後發現,資料庫連線數已達到了上限。
課長 :
DB接続上限? 昨日のリリースで設定を変更しましたよね。![]()
科長 :
資料庫連線上限?昨天發佈時我們修改過設置,對吧?
社員A :
はい、最大接続数を100から200に増やしたのですが、バッチ処理が重なった時間帯に急増したようです。![]()
職員A :
是的,將最大連接數從100提高到了200,但似乎在批次重疊的時段連接數急劇增加了。
課長 :
再発防止のために、バッチ処理のスケジュールをずらす必要がありそうですね。![]()
科長 :
為了防止再次發生,看起來需要調整批次的執行時間。
社員A :
とりあえず一時的にアプリケーションを再起動し、接続をリセットしました。今は復旧しています。![]()
職員A :
目前暫時重啟了程序,重置了連線。現在已經恢復正常了。
課長 :
ありがとうございます。原因は設定ミスではなく、想定外の負荷という認識でよろしいですか?![]()
科長 :
謝謝。問題原因不是設定錯誤,而是意料之外的負載,對嗎?
社員A :
はい。アクセス数が通常の3倍近くになっていたため、負荷試験の条件を見直す必要があると思います。![]()
職員A :
是的。訪問量比平常增加了近3倍,我認為需要重新審視負載測試的條件。
課長 :
了解しました。では、一次報告として原因と対応内容をまとめ、クライアントには私から連絡します。![]()
科長 :
了解了。那就作為一次報告,把原因和應對措施整理一下,我會聯絡客戶。
社員B :
報告書のフォーマットはいつもの「障害対応報告書」でよろしいですか?![]()
職員B :
報告的格式還是用平常的「故障處理報告書」嗎?
課長 :
はい、それでお願いします。明日午前までに提出してください。![]()
科長 :
是的,請用那個格式。明天上午之前提交。
社員B :
承知致しました。再発防止策も併せて記載致します。![]()
職員B :
明白了。我會連同再發防止措施一起寫進去。
課長 :
助かります。今回の件は軽微ですが、今後のために検証環境でも再現テストをお願いします。![]()
科長 :
謝謝。這次問題不嚴重,但為了防止日後再發生,請在測試環境中也進行重現測試。
社員A :
了解しました。本番への影響は完全に解消しています。![]()
職員A :
明白。本番環境的影響已完全解決。
課長 :
ありがとうございます。では、今回の障害対応はこれで一区切りとしましょう。お疲れさまでした。![]()
科長 :
謝謝。那麼這次的故障處理就先到這裡。辛苦大家了。