MapD: Cơ sở dữ liệu hoạt động trên GPU

Hôm nay chúng tôi thấy mình đang trải qua hiện tượng Dữ Liệu Lớn., chúng tôi có thể thu được một lượng lớn dữ liệu từ vô số nguồn. Lượng dữ liệu khổng lồ này mang lại nhiều lợi ích, nhưng nó cũng mang lại nhiều thách thức. Điểm chung nhất trong số đó: thời gian phản hồi trong tập dữ liệu hàng loạt.

1

Bản đồD được sinh ra để cung cấp tốc độ cao trong lĩnh vực cơ sở dữ liệu phân tích. Được thiết kế để xử lý hàng nghìn tỷ bản ghi trong một phần nghìn giây tận dụng sức mạnh tính toán do GPU. Được xây dựng chính xác để tận dụng tối đa tất cả các khả năng phần cứng và phần mềm có sẵn trong card đồ họa, nó cung cấp cho các nhà phân tích và nhà khoa học dữ liệu thời gian phản hồi khoảng 3 bậc độ lớn (x1000) so với các công nghệ trước đây được sử dụng cho các mục đích này. Tận dụng tính song song của GPU (Khoảng 80000 lõi trong GPU hiện đại) và băng thông bộ nhớ lớn (Khoảng 8Gbps) để thực hiện các tìm kiếm đại số tuyến tính và cơ sở dữ liệu, sử dụng LLVM để biên dịch theo thời gian thực. truy vấn, ngoài việc lưu giữ dữ liệu được tham khảo nhiều nhất trong bộ nhớ cache của GPU (bộ nhớ DDR5 tốc độ cao).

Chúng ta phải nhớ rằng trong thế giới Dữ liệu lớn, cơ sở dữ liệu truyền thống không được sử dụng dựa trên việc ghi và lưu giữ các tệp, vì những cơ sở dữ liệu này sẽ gây ra quá nhiều tác vụ I / O trên đĩa cứng. Với mục đích phân tích hàng tỷ bản ghi, cơ sở dữ liệu trong bộ nhớ, như Apache Spark. Tuy nhiên, để có được dung lượng bộ nhớ cần thiết và hiệu suất mong muốn, một cụm máy chủ là cần thiết và chúng tôi biết rằng điều này có nghĩa là chi phí phần cứng, hệ thống cáp mạng và số lượng kỹ thuật viên lớn hơn. Vì vậy, Bản đồD mang lại khả năng đạt được hiệu suất cao với ít chi phí và độ phức tạp hơn, cho phép nhiều người hơn có quyền truy cập vào các công nghệ hiệu suất cao để phân tích dữ liệu.

3

Nhờ được hỗ trợ bởi GPU, MapD cũng cung cấp một môi trường để trực quan hóa dữ liệu tận dụng khả năng đồ họa của GPU. Nó tạo điều kiện thuận lợi cho việc tạo ra các đồ thị tương tác với khối lượng dữ liệu lớn, cho phép tương tác với thông tin gần như trong thời gian thực (giấc mơ ướt át của mọi nhà phân tích dữ liệu). Ngoài việc bao gồm một số thuật toán học máy (Machine Learning), để thực hiện phân tích nâng cao với cùng một môi trường sử dụng GPU.

2

Chúng tôi mời bạn dạo qua Trang chính thức của MapD để xem xét chi tiết hơn từng tính năng của nó. Họ cũng cung cấp một bài báo mà bạn có thể tải xuống miễn phí, trình bày chi tiết các công nghệ và cách tiếp cận đã làm cho MapD trở nên khả thi. Bạn thậm chí có thể thưởng thức một số demo thật ngạc nhiên!
MapD hiện đang trong giai đoạn thử nghiệm và có sẵn cho Linux, bạn có thể viết thư cho họ (cùng với một tuyên bố giải thích) để tham gia vào nó.


Một bình luận, để lại của bạn

Để lại bình luận của bạn

địa chỉ email của bạn sẽ không được công bố. Các trường bắt buộc được đánh dấu bằng *

*

*

  1. Chịu trách nhiệm về dữ liệu: Miguel Ángel Gatón
  2. Mục đích của dữ liệu: Kiểm soát SPAM, quản lý bình luận.
  3. Hợp pháp: Sự đồng ý của bạn
  4. Truyền thông dữ liệu: Dữ liệu sẽ không được thông báo cho các bên thứ ba trừ khi có nghĩa vụ pháp lý.
  5. Lưu trữ dữ liệu: Cơ sở dữ liệu do Occentus Networks (EU) lưu trữ
  6. Quyền: Bất cứ lúc nào bạn có thể giới hạn, khôi phục và xóa thông tin của mình.

  1.   Jesus Perales dijo

    Đừng bao giờ tưởng tượng ra những thứ như vậy, nếu lúc đầu nó có vẻ lạ lẫm với tôi khi suy nghĩ lại, mọi thứ đều là để làm trước