对话全文
科长
急な招集ですみません。今朝8時ごろからシステムが応答しなくなったとの報告がありました。現在の状況を教えてください。临时召集大家很抱歉。今天早上8点左右开始收到系统无响应的报告。请告诉我目前的状况。职员A
はい。現在、本番サーバーのAPIがタイムアウトを起こしています。ログを確認したところ、DB接続数が上限に達していました。好的。现在生产环境的服务器的API响应出现了超时。检查日志后发现,数据库连接数已达到了上限。科长
DB接続上限? 昨日のリリースで設定を変更しましたよね。数据库连接上限?昨天发布时我们修改过设置,对吧?职员A
はい、最大接続数を100から200に増やしたのですが、バッチ処理が重なった時間帯に急増したようです。是的,将最大连接数从100提高到了200,但似乎在批处理重叠的时段连接数急剧增加了。科长
再発防止のために、バッチ処理のスケジュールをずらす必要がありそうですね。为了防止再次发生,看起来需要调整批处理的执行时间。职员A
とりあえず一時的にアプリケーションを再起動し、接続をリセットしました。今は復旧しています。目前暂时重启了程序,重置了连接。现在已经恢复正常了。科长
ありがとうございます。原因は設定ミスではなく、想定外の負荷という認識でよろしいですか?谢谢。问题原因不是设置错误,而是意料之外的负载,对吗?职员A
はい。アクセス数が通常の3倍近くになっていたため、負荷試験の条件を見直す必要があると思います。是的。访问量比平时增加了近3倍,我认为需要重新审视负载测试的条件。科长
了解しました。では、一次報告として原因と対応内容をまとめ、クライアントには私から連絡します。了解了。那就作为一次报告,把原因和应对措施整理一下,我会联系客户。职员B
報告書のフォーマットはいつもの「障害対応報告書」でよろしいですか?报告的格式还是用平时的「故障处理报告书」吗?科长
はい、それでお願いします。明日午前までに提出してください。是的,请用那个格式。明天上午之前提交。职员B
承知致しました。再発防止策も併せて記載致します。明白了。我会连同再发防止措施一起写进去。科长
助かります。今回の件は軽微ですが、今後のために検証環境でも再現テストをお願いします。谢谢。这次问题不严重,但为了防止以后再发生,请在测试环境中也进行重现测试。职员A
了解しました。本番への影響は完全に解消しています。明白。本番环境的影响已经完全解决。科长
ありがとうございます。では、今回の障害対応はこれで一区切りとしましょう。お疲れさまでした。谢谢。那么这次的故障处理就先到这里。辛苦大家了。