MapD: banco de dados que funciona em GPUs

Hoje nos encontramos experimentando o fenômeno de Big Data, podemos obter uma quantidade imensa de dados de um número infinito de fontes. Essa imensa quantidade de dados traz muitos benefícios, mas também traz muitos desafios. O mais comum deles: tempos de resposta em conjunto de dados em massa.

1

Mapa D nasceu para oferecer altas velocidades no campo de bancos de dados analíticos. Projetado para processar trilhões de registros em questão de milissegundos aproveitando o poder de computação oferecido por GPUs. Construído precisamente para aproveitar ao máximo todos os recursos de hardware e software disponíveis em placas gráficas, ele oferece tempos de resposta de analistas e cientistas de dados de cerca de 3 ordens de magnitude (x1000) acima das tecnologias anteriormente empregadas para esses fins. Aproveitando o paralelismo de GPUs (aproximadamente 80000 núcleos em GPUs modernas) e grandes larguras de banda de memória (em torno de 8 Gbps) para realizar tarefas de álgebra linear e pesquisas de banco de dados, usando LLVM para compilar em tempo real cada consulta, além de manter os dados mais consultados no cache das GPUs (memórias DDR5 de alta velocidade).

Devemos lembrar que no mundo do Big Data não são utilizados bancos de dados tradicionais, baseados na gravação e preservação de arquivos, pois isso causaria uma quantidade excessiva de tarefas de I / O no disco rígido. Com o objetivo de analisar bilhões de registros, o bancos de dados na memória, como o Apache Spark. Porém, para obter a quantidade de memória necessária e o desempenho desejado, é necessário um cluster de servidores e sabemos que isso implica em custos de hardware, cabeamento de rede e um maior número de técnicos. Portanto, Mapa D oferece a capacidade de atingir alto desempenho com menos custo e complexidade, permitindo que mais pessoas tenham acesso a tecnologias de alto desempenho para análise de dados.

3

Graças ao suporte de GPUs, o MapD também oferece um ambiente para visualização de dados aproveitando os recursos gráficos das GPUs. Facilita a criação de gráficos interativos com alto volume de dados, permitindo a interação com as informações quase em tempo real (o sonho molhado de todo analista de dados). Além de incluir alguns algoritmos de aprendizado de máquina (Machine Learning), para realizar análises avançadas com o mesmo ambiente utilizando GPUs.

2

Nós convidamos você a passear pelo Página oficial do MapD para revisar cada um de seus recursos com mais detalhes. Eles também oferecem um artigo, que você pode baixar gratuitamente, detalhando as tecnologias e abordagens que tornaram o MapD possível. Você pode até desfrutar de alguns demos surpreendente!
MapD está atualmente em beta e disponível para Linux, você pode escrever para eles (junto com uma declaração explicativa) para participar.


Deixe um comentário

Seu endereço de email não será publicado. Campos obrigatórios são marcados com *

*

*

  1. Responsável pelos dados: Miguel Ángel Gatón
  2. Finalidade dos dados: Controle de SPAM, gerenciamento de comentários.
  3. Legitimação: Seu consentimento
  4. Comunicação de dados: Os dados não serão comunicados a terceiros, exceto por obrigação legal.
  5. Armazenamento de dados: banco de dados hospedado pela Occentus Networks (UE)
  6. Direitos: A qualquer momento você pode limitar, recuperar e excluir suas informações.

  1.   Jesus Perales dito

    Nunca imagine esse tipo de coisa, se a princípio me pareceu estranho repensar, tudo é pelo avanço