7月25日、SRE Weekly Issue #280が公開された。
SRE Weeklyは、SRE(Site Reliability Engineering)に関する注目情報を紹介するメールマガジン。
堅牢性の原則がもたらす弊害
The Harmful Consequences of the Robustness Principle
堅牢性の原則(送信するものに関しては厳密に、受信するものに関しては寛容に)は成熟したプロトコルの開発には最適でないかもしれない。
私たちはKubernetesを使用していません。
なぜKubernetesが自分たちに合わないのかを説明している。
サービス停止時(CDN停止時など)の個人情報漏洩報告
Personal data breach reporting for service outages (such as when your CDN is down)
セキュリティとは無関係のサービス停止は、GDPRなどの「個人情報漏洩」にあたるのか?
他には以下の記事が紹介されている。
- DevSecOpsを行う際、SREを忘れてはならない (When You Do DevSecOps, Don’t Forget the SREs)
- 三ばか大将問題の解決 (Solving the Three Stooges Problem)
- 何が原因として認められるのか? (What’s allowed to count as a cause?)
- IC1 Reliabilityエンジニア - Dropboxエンジニアリングキャリアフレームワーク (IC1 Reliability Engineer – Dropbox Engineering Career Framework)
- インシデント、レスポンス、そしてティム・ニコラスと人々 (Incidents, Response, and the People With Tim Nicholas)
- Facebook、MySQL 8.0 に移行する (Migrating Facebook to MySQL 8.0)
以下は様々なサイト障害に関する情報共有。
- Akamai
Akamaiは、「エッジDNSサービスインシデント」と呼ばれる事態に陥った。 - Let’s Encrypt
- Disney park-related apps
- Heroku