工作 - 故障对应



チーム内の会議で、システム障害の対応について話しています。

小组会议中,正在谈论系统故障。



【对话全文】

課長 :

急な招集ですみません。今朝8時ごろからシステムが応答しなくなったとの報告がありました。現在の状況を教えてください。

科长 :

临时召集大家很抱歉。今天早上8点左右开始收到系统无响应的报告。请告诉我目前的状况。

社員A :

はい。現在、本番サーバーのAPIがタイムアウトを起こしています。ログを確認したところ、DB接続数が上限に達していました。

职员A :

好的。现在生产环境的服务器的API响应出现了超时。检查日志后发现,数据库连接数已达到了上限。

課長 :

DB接続上限? 昨日のリリースで設定を変更しましたよね。

科长 :

数据库连接上限?昨天发布时我们修改过设置,对吧?

社員A :

はい、最大接続数を100から200に増やしたのですが、バッチ処理が重なった時間帯に急増したようです。

职员A :

是的,将最大连接数从100提高到了200,但似乎在批处理重叠的时段连接数急剧增加了。

課長 :

再発防止のために、バッチ処理のスケジュールをずらす必要がありそうですね。

科长 :

为了防止再次发生,看起来需要调整批处理的执行时间。

社員A :

とりあえず一時的にアプリケーションを再起動し、接続をリセットしました。今は復旧しています。

职员A :

目前暂时重启了程序,重置了连接。现在已经恢复正常了。

課長 :

ありがとうございます。原因は設定ミスではなく、想定外の負荷という認識でよろしいですか?

科长 :

谢谢。问题原因不是设置错误,而是意料之外的负载,对吗?

社員A :

はい。アクセス数が通常の3倍近くになっていたため、負荷試験の条件を見直す必要があると思います。

职员A :

是的。访问量比平时增加了近3倍,我认为需要重新审视负载测试的条件。

課長 :

了解しました。では、一次報告として原因と対応内容をまとめ、クライアントには私から連絡します。

科长 :

了解了。那就作为一次报告,把原因和应对措施整理一下,我会联系客户。

社員B :

報告書のフォーマットはいつもの「障害対応報告書」でよろしいですか?

职员B :

报告的格式还是用平时的「故障处理报告书」吗?

課長 :

はい、それでお願いします。明日午前までに提出してください。

科长 :

是的,请用那个格式。明天上午之前提交。

社員B :

承知致しました。再発防止策も併せて記載致します。

职员B :

明白了。我会连同再发防止措施一起写进去。

課長 :

助かります。今回の件は軽微ですが、今後のために検証環境でも再現テストをお願いします。

科长 :

谢谢。这次问题不严重,但为了防止以后再发生,请在测试环境中也进行重现测试。

社員A :

了解しました。本番への影響は完全に解消しています。

职员A :

明白。本番环境的影响已经完全解决。

課長 :

ありがとうございます。では、今回の障害対応はこれで一区切りとしましょう。お疲れさまでした。

科长 :

谢谢。那么这次的故障处理就先到这里。辛苦大家了。