Get Things Right

My English blog is here http://getthingsright.blogspot.com/

IT技術の階層(レイアー)下から上まで  其の一(データセンター)

IT技術は階層になっている。最終的なパフォーマンスは常に下の階層に依存する。だから最下層であるデータセンターから効率化を考えるということは大事なことだ。しかしデータセンターからネットワーク機器やサーバ、そしてOSやプログラムなど、全ての層を俯瞰して全体最適化ができる会社は数が限られている。

自分はコンピュータが人間の知性を超えていくと信じている。未来ではデータセンターやコンピュータの効率は「(1)知性(IQ/EQなど)÷ 投資額」で測られると信じている。グーグルはDatacenter as Computerを既に構築し、未来ではDatacenter as Computer for Intelligence となりIoTの進化とともに全ての機器がネットワークに繋がればthe World as Computer for Intelligenceの時代が来ると考えている。

データセンター運用の固定費や減価償却費などを除き、変動費に注目すれば 電力費が一番大きい経費。ならばデータセンターの効率は 「(2)処理(演算)÷電力費」で測れる。処理(演算)はすべてクロックという離散単位で動き、1クロックにつき処理できる演算数はコンピューターアーキテクチャに依存する。もしくはプログラムの処理時間でもって処理を測っても良い。

電力は電力会社からの配電→UPS(電池付き電源装置)→PDU(配電盤)→サーバと通すことで失われ、熱になったり電圧を落としたりすることでも失われる。空調や光源にも電力は使われ、データセンターで受け取っている電力のうち、全てが演算に使われるわけではない。(2)の式は理想形としてデータセンターが受け取る100%の電力が演算に使われること。寒冷地にデータセンターを置くのは空調に使われる電力費を下げるため。現在コンピューターアーキテクチャの大きなテーマは演算あたりの消費電力を下げることにあり、それは別に述べる。

式(2)をKPIとして改善に努力できる企業は少ない。データセンターは既成のものを借り、サーバとOSは既成のものを買うからだ。プログラムのみが変えられるならば効率は 「(3)スループット÷電力費」で測ることになる。

データセンター構築もしくは借りる場合は1)電力源、2)ネットワーク、3)交通網、4)予備電力の方法など冗長性の確保や大事になる。1)や2)は一つの地域では一つの電力会社・通信事業者しかない場合が多く、また異なる通信事業者でも同じ回線を共有していることもある。途上国や小さな国ではシスコなどネットワーク装置の予備在庫が国内にないことがあり契約では8時間以内に交換、実際には数日後交換ということも珍しくない。また外国からのトラフィックが多い場合、海底ケーブルの一つがサメに食いちぎられただけでトラフィック応答時間が変わることがある。土地代や電力費だけでなく、自然災害や工場・原子力発電所などの有無、そしてテロや戦争などの政治的安定性への考慮。データセンターの誘致には様々な要素があり、自治体や国の底力が試される。

データセンターは搬入される機器の最大ワット数を記録し、 ワット数合計が供給電力の最大値を超えないように制限することで、停電の危険を抑える。最近は仮想化やVBLOOKなどの高密度化で一つの機器の最大ワット数が高いものが多い。以前はラック数などの床面積がボトルネックだったのが電力供給や空調設備能力が新しいボトルネックになり、高密度装置に対応した新しい設計のデータセンターでなければ、床面積が余って無駄になることもありえる。

床面積が足りない際、 部屋を拡張する。防火や強度の為に壁を変更できなかったり 、ビルならば壁や床を変えることで、耐久性の再計算をし、監督官庁の許可が必要な場合がある 。そうなると建築基準法などの知識が必要となる。借りている場所なら、構造物を大きく変えることはまず嫌がられるだろう。そうなると気合で相手を説得する人間力が大事になる。

ここで短歌一首。床足りず  笑って怒って  最後には 壁に穴あけ データセンター (字足りず) 


参考:

クラウドを支える技術 ―データセンターサイズのマシン設計法入門 (WEB+DB PRESS plus)

クラウドを支える技術 ―データセンターサイズのマシン設計法入門 (WEB+DB PRESS plus)

エクサスケールの衝撃

エクサスケールの衝撃