MapD:GPUで動作するデータベース

今日、私たちは自分自身が次の現象を経験していることに気づきます ビッグデータ、無限の数のソースから膨大な量のデータを取得できます。 この膨大な量のデータには多くの利点がありますが、多くの課題もあります。 それらの最も一般的なもの: バルクデータセットの応答時間.

1

地図D 分析データベースの分野で高速を提供するために生まれました。 処理するように設計されています 数ミリ秒で数兆のレコード によって提供される計算能力を利用する GPU。 グラフィックカードで利用可能なすべてのハードウェアおよびソフトウェア機能を最大限に活用するように正確に構築されており、アナリストおよびデータサイエンティストは、これらの目的で以前に採用されていたテクノロジーよりも約3桁(x1000)高い応答時間を提供します。 GPUの並列処理(最新のGPUでは約80000コア)と大きなメモリ帯域幅(約8Gbps)を利用して、線形代数タスクとデータベース検索を実行し、LLVMを使用して各コンサルテーションをリアルタイムでコンパイルし、最もコンサルトされたデータを保持しますGPU(高速DDR5メモリ)のキャッシュ内。

ビッグデータの世界では、ファイルの書き込みと保存に基づいて従来のデータベースが使用されていないことを覚えておく必要があります。これは、これらがハードディスク上で過剰な量のI / Oタスクを引き起こすためです。 数十億のレコードを分析する目的で、 インメモリデータベース、ApacheSparkのように。 ただし、必要なメモリ量と必要なパフォーマンスを得るには、サーバークラスターが必要であり、これはハードウェア、ネットワークケーブル、およびより多くの技術者のコストを意味することがわかっています。 したがって、 地図D より少ないコストと複雑さで高性能を実現する機能を提供し、より多くの人々がデータ分析のために高性能テクノロジーにアクセスできるようにします。

3

GPUでサポートされているおかげで、MapDも GPUのグラフィックス機能を利用したデータ視覚化のための環境を提供します。 大量のデータを含むインタラクティブなグラフの作成を容易にし、ほぼリアルタイムで情報と対話できるようにします(すべてのデータアナリストの夢精)。 いくつかの機械学習アルゴリズム(機械学習)を含めることに加えて、GPUを使用して同じ環境で高度な分析を実行します。

2

散歩することをお勧めします MapD公式ページ それぞれの機能をより詳細に確認します。 また、無料でダウンロードできるペーパーも提供しており、MapDを可能にしたテクノロジーとアプローチについて詳しく説明しています。 あなたも楽しむことができます デモ 意外!
MapDは現在ベータ版であり、 Linuxで利用可能、あなたはそれに参加するために(説明文と一緒に)彼らに書くことができます。


コメントを残す

あなたのメールアドレスが公開されることはありません。 必須フィールドには付いています *

*

*

  1. データの責任者:MiguelÁngelGatón
  2. データの目的:SPAMの制御、コメント管理。
  3. 正当化:あなたの同意
  4. データの伝達:法的義務がある場合を除き、データが第三者に伝達されることはありません。
  5. データストレージ:Occentus Networks(EU)がホストするデータベース
  6. 権利:いつでも情報を制限、回復、削除できます。

  1.   イエス・ペラレス

    そのようなことを想像しないでください、最初にそれが私に奇妙に思われた場合、rethinkdb、すべては進歩のためです