隙あらば寝る

うぇぶのかいしゃではたらくえんじにあがかいています

バックアップとは

GitLab.com Database Incident - 2017/01/31

 

gitlab.com の障害。

 

操作ミスでDBのファイル削除で障害。

 

まぁここまではよくあるが、ここからがつらい。

 

24時間単位でLVMスナップショットがあるはずが設定ミスで存在せず、今までバックアップは動作していなかったとのこと。

 

幸い6時間前に手動で取ったデータがあったそうでそこから復旧しているようだ。

 

リポジトリのデータはここに含まれないとのことなので、影響範囲自体はそれほど広くないと思われる。

 

バックアップはリストアまで含めて確認しておこうというのはよく言われるが、なかなか徹底は難しい。

 

運用レベルが低かったと言われてしまうのはしょうがないが、この類のミスを非難するのはつらい。