写真提供:マイナビニュース

写真拡大

●Data Fabricは、実際のビジネスとして提供できる
米国NetApp社は、10月12日からラスベガス市で、技術カンファレンスInsight 2015を開催した。ここでは、同イベントをレポートする。

NetApp社は、ストレージに特化した専用機を製品とする「ストレージ専業メーカー」だ。まったくの無名というわけではないが、エンタープライズ系のインフラ構築やデータセンタークラスのシステムなど比較的大規模なシステムで使われることもあり、誰でも名前を知っているわけではない。特に日本では、日本法人であるネットアップ株式会社があるが、OEMとして富士通がNetApp製品を製品を扱っていることもあり、富士通扱いで販売されており、どちらかというと「知る人ぞ知る」メーカーといえるかもしれない。なお、NetApp社は、当初「ネットワークアプライアンス」という名前で創業、本社をカルフォルニア州サニーベールに置く。

Insightは、毎年開催されており、販売パートナーや顧客などの技術者が対象だ。基調講演や展示会場、技術セッションなどからなる、米国での一般的な技術カンファレンスの構成を取る。ただし、基調講演に相当するものが、毎日、夕方行われる点(多くのイベントでは、朝、一番最初に基調講演を行うことがほとんど)が多少違う。

筆者も、このイベントに参加するまで、ニュースなどでNetApp社の存在や、ストレージ専業メーカーであることは認識していたが、具体的にどのような製品でどのようなビジネスを行っているのかは知らなかった。しかし、NetApp社は、1992年の創業だが、すでに世界150カ所に拠点を持ち、1万2,000人以上の社員を擁する企業にまで成長している。このInsightにも5,000人の参加者がいるという。現在の同社のアプライアンスは、インテル社のXeonプロセッサを利用しており、インテルもInsightのスポンサーの1つだという。

さて、今回のIsight 2015では、同時にMedia Sammitとして、プレス発表やブリーフィングも行われた。Insight初日は、製品発表から開始された。NetAppは、昨年「Data Fabric」というビジョンを発表している。これは、ローカルにあるデータ、サービスプロバイダーなどにあるデータ、クラウドにあるデータなど、さまざまな「場所」でデータ移動の自由度を高めることで、継ぎ目のないデータ管理を行うというもの。この「Data Fabric」を実現するものとして「ハイブリッドクラウド」がある。ローカル(オンプレミス)のストレージとクラウド側のストレージを組み合わせたストレージシステムで、ローカルストレージの高速性と、クラウドストレージの可用性、アクセスの容易さなどを両立させるものだ。

今年は、このData Fabricをさらに拡大するものとして、スターターキットである「ソリューションエッセンシャル」、また、Data Fabricの構築をサポートする「イネーブルメントサービス」、そしてストレージ製品とグーグルとの提携を発表した。

初日の基調講演(同イベントではGeneral Sessionと呼ぶ)には、CEOのジョージ・クリアン氏が登壇。「Data Powered Digital Future」と題した講演を行った。ストレージビジネスを行う同社らしく、未来は「データ」にあるというわけだ。当日の発表を踏まえ同社の提案する「Data Fabric」は、「実際のビジネスとして提供できる」ものだと述べた。ローカルとクラウドのストレージを統合するハイブリッド・クラウドは、「将来のアーキテクチャ」であり、NetAppはこれを実現するとした。

同氏によれば、NetAppのフラッシュストレージ製品「All Flash FAS」(FASはFabric-Attached Storageの略だとされる)は、出荷量が140%の伸びとなったという。

その後、米Cisco社のニック・アール氏が招待話者として登壇した。Cisco社は、FlexPodと呼ばれるシステムを販売しているが、その中にNetAppのストレージシステムが使われている。Cisco社は、FlexPodは、予め、特定の用途に対して検証を行ったシステム。これをCiscoは、UCS(ユニファイド・コンピューティングシステム)と呼ぶ。たとえば、マイクロソフトのExchageやSharePoint、SAPのHANAなどの分野、用途を決め、それぞれに最適化し自動設定などの機能を加え、検証したFlexPodを提供するわけだ。自由度の高いハードウェアを用意してさまざまな用途に対応するのではなく、先にアプリケーションを決め、それに応じたシステム構成を作るわけだ。

このFlexPodにおけるCiscoとNetAppの協業は今年で5年目になる(翌日、NetApp社はFlexPodの5周年についてプレスリリースを出している)。同氏は、FlexPodにおけるData Fabricの重要性について語った。最近では、さまざまなものがネットワークに接続されつつあり、これに応じてインフラも変化しつつある。このため、大量のデータが蓄積されつつあり、それを利用してさまざまな「判断」や「評価」が可能になる反面、データを一カ所に集めて分析するといった従来のやり方が不可能になるだろうと予測した。データ自体には、寿命があり、短時間で分析を行う必要があり、データをすべて転送していたのでは間に合わなくなる可能性がある。このためには、データを動かすのではなく、データの存在している場所で分析を行う必要があるとした。FlexPodとそれに組み込まれたNetApp製品により、これが可能になるという。

●NetAppのビジョン、Data Fabricとは
さて、ここまでは、イベントのレポートなのだが、少しNetAppのストレージ製品について解説しておかないと、同社の提唱する「Data Fabric」の理解が困難だと思われる。

ネットワークの一番の「アプリケーション」は「ファイル共有」だ。一般にアプリケーションは、ファイルを利用して処理を行うため、ファイルシステムを持たないコンピューターシステムは存在しないといっても過言ではなく、外部記憶は、重要なコンポーネントであり、さまざまな分野で「ストレージ」は重要な役割を果たす。

ただ、ファイルサーバーと言ってしまうと、汎用のオペレーティングシステムの「片手間仕事」という印象もある。しかし、かつては、Netwareのようにファイル共有専用のシステムが使われていた時代もある。逆に言うと、汎用のオペレーティングシステムがファイルサーバーを兼用できるようになったのは、UnixワークステーションやWindows NTが使われはじめてからのことだ。

現在では、大規模なシステムでは、SAN(Storage Area Network)などを介して、論理的にファイルシステムを分離する方向がある。処理対象となるファイルを計算処理するシステムから分離することで、フォールトトレラントや柔軟なシステム構成を実現することができるからだ。

さて、NetAppが、ここまで成長してきた理由は、単にファイル共有用の専用機(アプライアンス)を作っていたからだけではなく、同社の専用機には、「Data ONTAP」と呼ばれる専用オペレーティングシステムが搭載されており、このOSが持つ、特殊なファイルシステムとストレージの仮想化などの機能のため、システム構築の柔軟性が高く、また、バックアップやスナップショットが高速に行えるというメリットを持つ。専用機であるがゆえに汎用OSのファイルサーバーにはない特徴と、高い性能を持っているわけだ。

Data ONTAPが持つファイルシステムは、WAFL(Write-Anywhere-File-Layout)と呼ばれる。これは、NetAppの3人の創業者であるデイブ・ヒッツ、ジェームス・ラウ、マイケル・マルコムの3人が1990年代に開発したものだ。WAFLでは、UnixのFFS(Fast File System)をベースに、さまざまな改良がくわえてある。まず、ファイルのメタデータ(ファイルのサイズや所有者、モードなど)を格納しているiノードをストレージの固定した領域ではなく、ファイル上に格納するようにしてある。ファイルの一部が書き換わった場合、ファイルを構成するブロックのうち、変更のあったものだけを新規に割り当てる「Copy On Write」が使われている。さらに「ログファイルシステム」の概念が導入されており、書き込みは、いったん不揮発性メモリに記録(ログ)され、その後、実際のブロックの配置(書き込み)が行われる。

ファイル上にiノードを持つ「iノードファイル」を使うことで、ストレージの容量拡大が簡単に行えるようになる。また、Copy On Writeが使われているため、ストレージの現在の状態を記録する「スナップショット」は、iノードファイルをコピーするだけで済む。スナップショットは、ファイルの内容を記録しているブロックをコピーしないため、容量の増加はわずかで済む。スナップショットがあることで、不意のシャットダウンなどの場合に、直前の正常だった状態に簡単に戻すことが可能になり、再起動後にストレージをスキャンして一貫性を確認する必要がなくなり、サービス再開までの時間を大幅に短縮できる。

不揮発性メモリを使うログにより、外部からみた書き込み速度が大幅に向上する。ネットワークからの書き込みリクエストは不揮発性メモリに記録するだけで完了するからだ。このログは一定時間ごとにまとめてストレージに書き込みを行う。このとき、ストレージシステムへの最適化(たとえばRAID構成の場合など)や重複排除(ファイルにかかわらず同じ内容を持つブロックを1つに集約すること)が可能になる。

なお、以上の解説は、あくまでも最初のWAFLの実装に関する論文をベースにしたもので、現在では、さらに改良が加えられていると考えられる。また,NetAppは、複数の独立したストレージシステムで動作するData ONTAPをクラスター化する「Clasterd Data ONTAP」や、アマゾンのAWS(Amazon Web Services)上で動くソフトウェア「Cloud ONTAP for AWS」を提供している。

ストレージサービスを前提に作られた専用オペレーティングシステムを使うことで、NetAppのストレージアプライアンスは、汎用オペレーティングシステムのファイル共有サービスよりも高い性能や可用性を引き出すことが可能になっているようだ。

Data Fabricでは、クラウド、ローカル、サービスプロバイダー上のファイルへのアクセスを自由に行えるようにしているが、こうした構成もData ONTAPによって可能になっている。Data ONTAPではブロックレベルで重複排除が行われているため、ファイルのサイズを合計した見かけ上の容量よりも、実際に使われている容量は小さくなる。このため、システム間のデータ移動に要する時間も短縮が可能だ。また、Copy-On-Writeにより、ファイルが書き換えられても変更のあったブロックのみを転送すればよい。AWSの上で動作するCloud ONTAPにより、クラウドストレージもローカルのNetAppストレージアプライアンスと連携して動作できるようになる。

Data Fabricやハイブリッドクラウドは、このようにData ONTAPという専用オペレーティングシステムによって可能になるコンセプトといえるだろう。

(塩田紳二)