9月5日、SRE Weekly Issue #286が公開された。
SRE Weeklyは、SRE(Site Reliability Engineering)に関する注目情報を紹介するメールマガジン。
Kill It With Fireの書評
Marianne Bellottiの「Kill It With Fire」というレガシーシステムの近代化に関する本のレビュー記事。
この本は、SREの影響を強く受けながら、運用コンセプトや「システムの周りにあるシステム」に重点をおいている。
すべてのソフトウェアエンジニアリングの面接に、運用の質問を含めるべき理由
Why every software engineering interview should include ops questions
このブログ記事の原案は2016年だが、今ではさらに関連性が高くなっている。
"なぜ"だけでなく、インタビューの質問についてもいくつかのアイデアが掲載されている。
問題のフレーミングが持つ力
The power of framing a problem
良いストーリーを語れば、物事を実現することができます。
SREとしては、やるべきことはわかっていても、人を納得させるのは難しいものである。
他には以下の記事が紹介されている。
- イージージェットのA320が、ユナイテッド航空のボーイング787にゴーアラウンドの指示 (Easyjet A320 tells United Boeing 787 to GO AROUND! - YouTube)
- 「観測性におけるSREの役割」 (The Role of SREs in Observability)
- 「カスケードのリトライと不機嫌なアプリケーション」 (Cascading retries and the sulky applications)
- GitHub Availability Report: August 2021
以下は様々なサイト障害に関する情報共有。