京都大学学術情報メディアセンターは28日、日本ヒューレット・パッカードが開発したスパコン用ストレージバックアップするプログラムの不具合により、大容量ストレージ(/LARGE0)の一部が意図せず削除されたと発表した。
不具合が発生したのは、2021年12月14日~16日の内、12月3日17時32分以降更新がなかったファイルで、消失ファイル数は約3,400万、容量は約77TBに達する。ファイル消失の原因は、バックアッププログラムの機能改修において、不用意なプログラムの修正とその適用手順に問題があったことで、本来は不要になった過去のバックアップログファイルを削除する処理が、/LARGE0ディレクトリ配下のファイル群を削除してしまう処理として誤動作した。
日本HPでは、京都大学宛の報告書で「弊社100%の責任によりLustreファイルシステムのファイル消失の重大障害を来し、多大なるご迷惑をお掛けしたことを深くお詫び申し上げます」と述べている。
現在はバックアップ処理を停止しており、プログラムの問題を改善し、確実に再発しない対策をした上で1月末までにはバックアップを再開する予定。
また、ファイル消失後にバックアップが実行されてしまった領域のファイルの復元ができない状況となったことから、将来的にはこれまでのミラーリングによるバックアップだけでなく、1世代分の増分バックアップを残す等の機能強化を検討する。
https://pc.watch.impress.co.jp/docs/news/1378005.html
破壊に時間がかかるバックアップが正解
うちの会社なんて全体で40GBのデータしかないのに
それはいくら何でも少な過ぎじゃね?
今時40GBはスマホだぞ
WordとExcelだけなら1年分のデータが数GBで足りる
必要な情報はASPタイプのソフトに入ってるから、自社で保管しているデータはサーバー上だとそんなもんしかないんだよ。
各自のパソコンにどの程度のデータが保存されてるかは知らんけど。
対処を間違うとHPEクレイが日本のスパコン市場から撤退せざるを得なくなるような事態なんだろうな
まず最初にhpのソフトを全てアンインストールして復元ポイントを作ってようやく普通のPCの出荷状態になる
ドンぐらい時間かかるか知らんけど
まず本体の元データを削除して、その更新を元にバックアップを削除してるから
本体もバックアップも両方ファイルは消失してるんだわ。
学術研究データだと、研究者にとってはなかなかつらいだろうな
セクター読んでデータサルベージ出来るならよいけど、テラバイトもあると厳しいか
俺のPCのHDDでも8TBはあるぞ
SSD入れたら10TB
大したことないだろw
ただし一つの不具合で同時にクラッシュするトコロはいけません
企業ならとことん責任転嫁するだろうな。
ちょうど次期更新の入札時期が来ていて、来年2月締切になっている
富岳ベースで1大学用に縮小したのを入れればいいのに
1日30TB以上書き込んでるのか
データ全体では何テラバイトくらいあるんだろうな
動画や画像なら大したことないが、
研究記録などのドキュメント原本なら悲惨。
どちらも想定が甘い
すごいよね。
これやった奴は間違いなくわざとだから捕まえて10年ぐらい自衛隊に拷問させないとだめだぞ
メーカーだけでは食えないから大変だよな。
銀行とかにも下請けで入ってるの見かけるし。
京大だしな
京大ともあろうものが完全に
切り離した状態で保存してないのかよ
任せるほうも問題だわ
>>1
元記事では
>日本ヒューレット・パッカードでは…
って書いてあるのに何で「日本HPでは…」に直してるの
日本ヒューレット・パッカードは日本HPE
Enterprise製品を扱う会社で今回やらかしたとこ
日本HPは株式会社日本HPで別の会社。PCとプリンタを扱う
別の会社
もとは同じ会社だけど2015年に分社した
データの詳細は発表した?
スパコン扱うエンジニアのやるミスじゃないな
https://www.itmedia.co.jp/news/articles/2112/29/news040.html
ファイル消失が発生した原因
バックアッブスクリブトには、findコマンドにより10日以L古いログフアイルを削除する処理が含まれています。
スクリプトの機能改善と合わせて、findコマンドの削除処理に渡す変数名を視認性・可読性を高めるため変更いたしましたが、
この修正したスクリブトのリリース手順に考慮不足がありました。
bashは、シェルスクリプトの実行中に適時シェルスクリブトを読み込みます。
この挙動による副作用を認識できておらず、実行中のスクリプトが存在している状態でスクリブトの上書きにより
リリースしてしまったことで、途中から修正したシェルスクリブトの再読み込みが発生し、
結果的に未定義の変数を含むfindコマンドが実行されてしまいました。
この結果、本来のログディレクトリに保存されたフアイルの削除をする処理ではなく、/LARGE0のファイルを削除して
しまいました。
あー、hpって昔からfind使ったスクリプトをバックアップ関連で使ってるな
THE 日本
bashがシェルスクリプトを実行中に適時読み込むとか、今回始めて知ったわ
プログラマーなら実行時に読む込むのが普通だと思ってるしな
俺みたいなLinuxに詳しくないIT土方が担当したら、普通に間違えそうw
まあでも、俺みたいな低レベル土方でも、スクリプト実行中に当該のスクリプト
ファイルを上書きするとか頭おかしいんじゃねーの?って思うが
Linux界隈ってそういうの普通なんかね?
俺がヒューレットパッカードの仕事してたときは、バックアップ機材の処理するひとは
むちゃくちゃ高価な教育コース受けたひとだけで、そこまで教えてるかしらんが
通常ではやんないようなことはしてたんだろな、現場で
引用元: ・https://egg.5ch.net/test/read.cgi/bizplus/1640757505/
コメントを残す