【IT】日本HP製ソフトの不具合で京大スパコンのデータ77TBが消失

1: 2021/12/29(水) 14:58:25.98 _USER

京都大学学術情報メディアセンターは28日、日本ヒューレット・パッカードが開発したスパコン用ストレージバックアップするプログラムの不具合により、大容量ストレージ(/LARGE0)の一部が意図せず削除されたと発表した。

不具合が発生したのは、2021年12月14日~16日の内、12月3日17時32分以降更新がなかったファイルで、消失ファイル数は約3,400万、容量は約77TBに達する。ファイル消失の原因は、バックアッププログラムの機能改修において、不用意なプログラムの修正とその適用手順に問題があったことで、本来は不要になった過去のバックアップログファイルを削除する処理が、/LARGE0ディレクトリ配下のファイル群を削除してしまう処理として誤動作した。

日本HPでは、京都大学宛の報告書で「弊社100%の責任によりLustreファイルシステムのファイル消失の重大障害を来し、多大なるご迷惑をお掛けしたことを深くお詫び申し上げます」と述べている。

現在はバックアップ処理を停止しており、プログラムの問題を改善し、確実に再発しない対策をした上で1月末までにはバックアップを再開する予定。

また、ファイル消失後にバックアップが実行されてしまった領域のファイルの復元ができない状況となったことから、将来的にはこれまでのミラーリングによるバックアップだけでなく、1世代分の増分バックアップを残す等の機能強化を検討する。
https://pc.watch.impress.co.jp/docs/news/1378005.html

2: 2021/12/29(水) 15:04:25.32
いちばんやっちゃダメなやつ

 

4: 2021/12/29(水) 15:06:37.02
だからテープを使えと

 

>>4
破壊に時間がかかるバックアップが正解

 

10: 2021/12/29(水) 15:20:00.96
77TBってすげーな
うちの会社なんて全体で40GBのデータしかないのに

 

>>10
それはいくら何でも少な過ぎじゃね?
今時40GBはスマホだぞ

 

>>19
WordとExcelだけなら1年分のデータが数GBで足りる

 

>>19
必要な情報はASPタイプのソフトに入ってるから、自社で保管しているデータはサーバー上だとそんなもんしかないんだよ。
各自のパソコンにどの程度のデータが保存されてるかは知らんけど。

 

11: 2021/12/29(水) 15:20:20.20
「弊社100%の責任」という表現が出てくるのがすごいな
対処を間違うとHPEクレイが日本のスパコン市場から撤退せざるを得なくなるような事態なんだろうな

 

12: 2021/12/29(水) 15:20:45.42
hpはクライアントPCでも独自クソソフト入れてくるからなぁ

 

>>12
まず最初にhpのソフトを全てアンインストールして復元ポイントを作ってようやく普通のPCの出荷状態になる

 

14: 2021/12/29(水) 15:21:58.06
バックアップとってるなら復元できるんじゃね?
ドンぐらい時間かかるか知らんけど

 

>>14
まず本体の元データを削除して、その更新を元にバックアップを削除してるから
本体もバックアップも両方ファイルは消失してるんだわ。

 

20: 2021/12/29(水) 15:27:03.20
一般企業の業務のデータならすんなり金で解決で良いだろうけど
学術研究データだと、研究者にとってはなかなかつらいだろうな
セクター読んでデータサルベージ出来るならよいけど、テラバイトもあると厳しいか

 

23: 2021/12/29(水) 15:30:24.68

俺のPCのHDDでも8TBはあるぞ
SSD入れたら10TB

大したことないだろw

 

25: 2021/12/29(水) 15:32:56.72
本当に必要なデータは必ず2か所以上に格納しておきましょう
ただし一つの不具合で同時にクラッシュするトコロはいけません

 

26: 2021/12/29(水) 15:34:33.45
hpはだめだなあ。やっぱりdellがイイね。

 

33: 2021/12/29(水) 15:39:18.25
百ぱーの責任と認める所がいいね、支那や韓国の
企業ならとことん責任転嫁するだろうな。

 

36: 2021/12/29(水) 15:43:15.36
京大のスパコンは長年富士通だったが2012年からクレイ(現HPE)が受注、2016年の更新でもクレイ製だった
ちょうど次期更新の入札時期が来ていて、来年2月締切になっている

 

>>36
富岳ベースで1大学用に縮小したのを入れればいいのに

 

38: 2021/12/29(水) 15:45:47.14
たった2日間の不具合で、上書きされた領域分の77TBが消失したということは
1日30TB以上書き込んでるのか
データ全体では何テラバイトくらいあるんだろうな

 

45: 2021/12/29(水) 15:54:57.00
77TBなんて
動画や画像なら大したことないが、
研究記録などのドキュメント原本なら悲惨。

 

46: 2021/12/29(水) 15:55:37.33
意地でも復元求めないならそこまでのデータ
どちらも想定が甘い

 

54: 2021/12/29(水) 16:02:00.33
1か月で77TBも消費するのが驚き

 

>>54
すごいよね。

 

59: 2021/12/29(水) 16:07:45.45
Made in Tokyowwwww

 

62: 2021/12/29(水) 16:09:12.34
プリンタの会社の社員に運用を任せるほうがどうかしてる

 

64: 2021/12/29(水) 16:12:01.82
ハードが一番でもソフトがクソなら意味ないやん

 

66: 2021/12/29(水) 16:13:13.90
>>1
これやった奴は間違いなくわざとだから捕まえて10年ぐらい自衛隊に拷問させないとだめだぞ

 

68: 2021/12/29(水) 16:16:32.15
関数電卓良かったな。
メーカーだけでは食えないから大変だよな。
銀行とかにも下請けで入ってるの見かけるし。

 

72: 2021/12/29(水) 16:25:43.08
中共スパイだらけ。

 

>>72
京大だしな

 

74: 2021/12/29(水) 16:26:57.90

京大ともあろうものが完全に
切り離した状態で保存してないのかよ

任せるほうも問題だわ

 

77: 2021/12/29(水) 16:33:54.94

>>1
元記事では
>日本ヒューレット・パッカードでは…
って書いてあるのに何で「日本HPでは…」に直してるの

日本ヒューレット・パッカードは日本HPE
Enterprise製品を扱う会社で今回やらかしたとこ
日本HPは株式会社日本HPで別の会社。PCとプリンタを扱う
別の会社
もとは同じ会社だけど2015年に分社した

 

80: 2021/12/29(水) 16:38:07.50
複数並列バックアップシステムじゃねぇのかい・・・らしくねぇな

 

81: 2021/12/29(水) 16:39:10.26
対策が日本人的で笑える

 

86: 2021/12/29(水) 16:43:24.87
確実に年末年始の休暇が飛んだやつが相当数いるなw

 

91: 2021/12/29(水) 16:47:08.86
L0が消えたって俺の寝床になんかあるのかね

 

94: 2021/12/29(水) 16:48:32.42
これがコロナの薬開発だったら意図を疑わざるを得ないな
データの詳細は発表した?

 

97: 2021/12/29(水) 16:50:24.86
ただ消しただけならサルベージ出来そうだけど。

 

98: 2021/12/29(水) 16:50:57.07
twitterで重いシェルの実行中にシェルを更新したとかなんとか

 

100: 2021/12/29(水) 16:54:46.34

スパコン扱うエンジニアのやるミスじゃないな

https://www.itmedia.co.jp/news/articles/2112/29/news040.html

ファイル消失が発生した原因
バックアッブスクリブトには、findコマンドにより10日以L古いログフアイルを削除する処理が含まれています。
スクリプトの機能改善と合わせて、findコマンドの削除処理に渡す変数名を視認性・可読性を高めるため変更いたしましたが、
この修正したスクリブトのリリース手順に考慮不足がありました。
bashは、シェルスクリプトの実行中に適時シェルスクリブトを読み込みます。
この挙動による副作用を認識できておらず、実行中のスクリプトが存在している状態でスクリブトの上書きにより
リリースしてしまったことで、途中から修正したシェルスクリブトの再読み込みが発生し、
結果的に未定義の変数を含むfindコマンドが実行されてしまいました。
この結果、本来のログディレクトリに保存されたフアイルの削除をする処理ではなく、/LARGE0のファイルを削除して
しまいました。

 

>>100
あー、hpって昔からfind使ったスクリプトをバックアップ関連で使ってるな

 

>>100
THE 日本

 

103: 2021/12/29(水) 17:02:02.66
「1TB当たり○○万円」とかの賠償金や保険はあるのかな

 

104: 2021/12/29(水) 17:04:40.88
こういうのは他山の石として気を引き締めよう

 

111: 2021/12/29(水) 17:15:41.72

bashがシェルスクリプトを実行中に適時読み込むとか、今回始めて知ったわ
プログラマーなら実行時に読む込むのが普通だと思ってるしな
俺みたいなLinuxに詳しくないIT土方が担当したら、普通に間違えそうw

まあでも、俺みたいな低レベル土方でも、スクリプト実行中に当該のスクリプト
ファイルを上書きするとか頭おかしいんじゃねーの?って思うが

Linux界隈ってそういうの普通なんかね?

 

>>111
俺がヒューレットパッカードの仕事してたときは、バックアップ機材の処理するひとは
むちゃくちゃ高価な教育コース受けたひとだけで、そこまで教えてるかしらんが
通常ではやんないようなことはしてたんだろな、現場で

 

112: 2021/12/29(水) 17:16:14.11
hp製を採用する判断をしたやつが無能すぎるだろw

 

113: 2021/12/29(水) 17:22:48.75
日本で組み立てただけなのに悪質スレタイ

 

引用元: ・https://egg.5ch.net/test/read.cgi/bizplus/1640757505/





コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です