SREに興味のある方向け、SRE Weekly #281が公開 - 「インシデントから学ぶ

8月1日、SRE Weekly Issue #281が公開された。
SRE Weeklyは、SRE（Site Reliability Engineering）に関する注目情報を紹介するメールマガジン。

レース開始の20分前に、F1マシンがサイドバリアに衝突。
チームは、信じられないほど冷静に、整然と、そしてスピーディーに事故対応を行い、破損した部品をこれまでにない速さで交換した。

素晴らしい分析と、8分間の素晴らしいビデオもあってお勧めだと述べている。
「みんなの冷静なコミュニケーションの仕方に耳を傾けてください」
「このような本番のインシデントの動画はめったにありません」

サーバーにEtsy、Betsy、Momoという名前をつけて、魚を食べさせ、ウンチを掃除していた昔の時代は終わりました。サーバーは私たちのペットでした。

基盤となるコンポーネントは牛となり、サービスが新しいペットになって、大切に育てていくのです

AWSは、顧客がインシデント対応プロセスで使用するためのサンプル/テンプレートをGitHubに公開した。

他には以下の記事が紹介されている。

その他、Let’s Encryptなどの障害に関するリストも掲載している。