ビッグデータ分析

コンピューター・ネットワークのトラフィック、データフィード、センサーデータ、イベントストリーム処理 (ESP) などのデータストリームには、大量の複雑なデータセットが関わります。このデータを処理するために、いくつかの新しいアプリケーションが進展しました。例えば、オープンソースの Hadoop フレームワークは、数千のシステムを同時に利用してデータ処理を高速化できます。もう 1 つのオープンソース・フレームワークである Spark は、Hadoop と互換性を持つデータ処理エンジンを提供します。しかし、これらのツールはプロセッサーを多用するため CPU がボトルネックになる可能性があります。FPGA を使用すると、データセンターはこれらの個別アプリケーションをハードウェア・レベルで実装し、システムのワットあたり性能を大幅に向上させることができます。

今日の CPU はコア数がますます増えるような進歩を遂げていますが、外部メモリーに与えられる帯域幅はマルチコア・コンピューティング・パワーと同じペースでは増えていません。FPGA は、圧縮、フィルタリング、および重複排除機能を提供して CPU によるデータアクセスのボトルネックを緩和できます。FPGA はデータの圧縮効率を向上させることもできます。例えば、Hadoop は単一サーバーに結果を戻すときの「シャッフル」フェーズを高速化しています。FPGA は、Spark でもデータ・ストリーミング、実データ、予測データ、シャッフルフェーズ圧縮、およびその他の機能を高速化できる利点を持っています。

ユーザーは、FPGA によって新しいデータ・インスタンスのクラスや値の予測といったリアルタイム分析を実行したり、保存するデータをフィルタリングしたりできます。これらのアプリケーションでは、1 つ以上の FPGA を使用して複雑なデータ処理を効率的に高速化します。