データ分析を高速化するインテル® FPGA

インテルは、オープン・スタンダードのビルディング・ブロックを使用して、ソフトウェア・デファインド・インフラストラクチャーを基盤とするビッグデータ分析フレームワークとライブラリーを開発してきました。エンタープライズ対応のオープン・ソフトウェア・プラットフォームから分析用ビルディング・ブロック、さらにはランタイムの最適化、ツール、ベンチマーク、ユースケースまで、ビッグデータと分析はインテルのソフトウェアによって高速かつ容易になり、優れた洞察をもたらします。例えば、Apache Hadoop と Spark に最適化したフレームワーク、インテル® データ・アナリティクス・アクセラレーション・ライブラリー (インテル® DAAL)、ディープ・ニューラル・ネットワーク向けインテル® マス・カーネル・ライブラリー (インテル® MKL-DNN) 上で動作する BigDL (Apache Spark 上の分散型ディープラーニング) などがあります。

これらのインテルのフレームワークとライブラリーは、インテル® FPGA のアクセラレーション・オプションに統合されています。アプリケーションに変更を加えることなくインテル® Xeon® プロセッサー、インテル® FPGA、またはその他のインテル® プラットフォーム上で実行することが可能です。インテルでは、エンドツーエンドのオーケストレーション、仮想化、セキュリティーといった FPGA アクセラレーション・フレームワークも提供しています。また、パートナー・エコシステムと共同で、多機能の単一インテル® FPGA を活用した NoSQL の非構造化リレーショナル・データ・ストアのアクセラレーションを提供することで、データストリーム、ネットワーク、データアクセス、アルゴリズムの高速化を実現しています。

従来型のリレーショナル・データベースは、ネットワーキング、データ・ストリーミング、データアクセスのインライン・アクセラレーションとプロトコルオフロードによって大幅に高速化することができます。インライン・アクセラレーターには、圧縮、フィルタリング、暗号化があります。FPGA は、キャッシュ管理、メモリーマッピングなどのメモリー・アクセスに使用することもできます。FPGA の柔軟なデータパスがハッシュ法やパターンマッチングにおいて高い効果を発揮するため、インデックス作成、検索、フィルタリングが非常に高速に動作します。

既存の SQL アプリケーションとデータベース・スキーマを変更せずに実行できるかどうかが重要なポイントですが、インテルのパートナーである Swarm64 AS では、PostgreSQL、MariaDB、MySQL データベース上ですぐに使えるアクセラレーション・ソリューション Swarm64 SDA を提供しています。Swarm64 SDA は、PCIe* FPGA カードと Linux* 用ドライバー・ソフトウェアに、上記のデータベース用の標準インターフェイスへのソフトウェア・プラグインを組み合わせたソリューションです。

Swarm64 AS は、256 GB のメモリーを搭載したインテル® Xeon® プロセッサー E5-2695 v4 とインテル® Arria® 10 FPGA ベースの PCIe* カードを使用して、PostgreSQL 9.6 上で高速データとリアルタイム分析のアクセラレーションを実証しました。通常の PostgreSQL 9.6 データベースに対して、Swarm64 SDA のアクセラレーションで強化した PostgreSQL 9.6 データベースのデータ挿入とクエリーが 5 倍以上高速に動作しました。†同社は、従来のデータ・ウェアハウス・アプリケーション全般で約 2 倍の高速化と 3 倍以上のストレージ圧縮を実現可能と予測しています。†このソリューションについては、概要ビデオをご覧ください。

インテルは、Hadoop/Spark の reduce フェーズまたは「shuffle」フェーズ向けにより優れた圧縮技術を開発しています。インテル® フレームワークに統合することで、FPGA をユーザーに意識させない手法をとっています。

Spark については、さらに 3 つのアクセラレーションがあります。

  • Ingest/Kafka: 抽出、変換、ロード (ETL) およびフィルタリング (パートナー)
  • BigDL:ディープラーニング・アクセラレーション (調査中)
  • マシンラーニング MLlib:ALS など (MCP POC)

NoSQL データストアでは大幅なオフロードも可能です。例えば、インテルのパートナーである Algo-Logic は FPGA を使用したネットワーク・プロトコルのオフロード、ローカルキャッシュ管理、高速検索によってキー・バリュー・ストア (KVS) のアクセラレーションを行っています。Algo-Logic は、1/10 未満のレイテンシーで 1 秒当たり 3 倍のメッセージを実現しました。また、FPGA アクセラレーションにより、ソフトウェアのみの KVS に比べてレイテンシーが予測可能になることも実証しました。予測可能なレイテンシーは、「レイテンシーの 99% を○○未満に維持する」といった規定をサービスレベル・アグリーメントに明記する場合に重要です。

† テストは、特定システムでの特定テストにおけるコンポーネントのパフォーマンスを測定しています。ハードウェア、ソフトウェア、システム構成などの違いにより、実際の性能は掲載された性能テストや評価とは異なる場合があります。購入を検討される場合は、ほかの情報も参考にして、パフォーマンスを総合的に評価することをお勧めします。性能やベンチマーク結果について、さらに詳しい情報をお知りになりたい場合は、www.intel.com/benchmarks (英語) を参照してください。