Gemma: Mô hình AI của Google dựa trên Gemini, hiện có sẵn dưới dạng nguồn mở

Đọt non

Gemma, một mô hình trí tuệ nhân tạo nguồn mở mới

Google đã công bố, thông qua một bài đăng trên blog, sự ra mắt của anh ấy dòng mô hình AI mới dựa trên chatbot Gemini, «Gemma«. Đây là mô hình học máy được xây dựng trên các công nghệ được sử dụng cho Gemini, mô hình chatbot của Google và cung cấp nhiều biến thể từ 2 đến 7 tỷ tham số, được thiết kế cho các ứng dụng và yêu cầu phần cứng khác nhau.

Gemma nhằm mục đích cung cấp cho các nhà phát triển công cụ nâng cao để tạo ứng dụng AI một cách có ý thức và trong số các lĩnh vực ứng dụng mà Gemma đề cập đến, nó được đề cập từ việc tạo ra hệ thống đối thoại và trợ lý ảo đến tạo văn bản, trả lời các câu hỏi bằng ngôn ngữ tự nhiên, tóm tắt nội dung, sửa văn bản và hỗ trợ học tập ngôn ngữ. Ngoài ra, mô hình này còn cho phép thao tác với nhiều loại dữ liệu văn bản khác nhau, bao gồm thơ, mã lập trình, viết lại văn bản và tạo thư bằng cách sử dụng các mẫu.

Và đó là Điểm nổi bật của Gemma là kích thước tương đối nhỏ của cô ấy, điều này tạo điều kiện thuận lợi việc triển khai nó trên phần cứng với nguồn lực hạn chế, chẳng hạn như máy tính xách tay và PC tiêu chuẩn. Trong các so sánh do Huggingface và Google thực hiện, mẫu Gemma-7B đã thể hiện hiệu suất ổn định, xếp thứ hai sau mẫu Trò chuyện LLama 2 70B trong so sánh của Huggingface. Trong so sánh của Google, Gemma-7B nhỉnh hơn một chút so với LLama 2 7B/13B và Mistral-7B.

Về phía hệ sinh thái của các công cụ và khuôn khổ, chatbot AI mới cung cấp sự tích hợp với một số lượng lớn các công cụ thường được các nhà phát triển sử dụng, vì nó có một số dự án quan trọng đã tích hợp hỗ trợ để làm việc với Gemma và trong số các dự án đã có hỗ trợ, nổi bật sau đây: Ôm mặt, MaxText, NVIDIA NeMo, TensorRT-LLM, Transformers, Bộ công cụ AI sáng tạo có trách nhiệm cùng nhiều công cụ khác.

Ngoài ra, Google đã phát hành một công cụ đầu ra độc lập có tên gemma.cpp, được viết bằng C++, dành riêng cho Gemma và hỗ trợ cho Gemma đã được thêm vào công cụ llama.cpp. Để tối ưu hóa mô hình, các nhà phát triển có thể tận dụng khung Keras và các chương trình phụ trợ cho TensorFlow, JAX và PyTorch.

Điều quan trọng là phải chú ý Mô hình Gemma có kích thước 8 nghìn token, giới hạn lượng thông tin mà nó có thể xử lý và ghi nhớ trong quá trình tạo văn bản (để so sánh, các mô hình như Gemini và GPT-4 có kích thước ngữ cảnh là 32 nghìn mã thông báo và GPT-4 Turbo có 128 nghìn). Ngoài ra, mô hình Gemma hiện chỉ hỗ trợ ngôn ngữ tiếng Anh.

Để đảm bảo tiêu chuẩn an toàn cao nhất, Google đã sử dụng các kỹ thuật tự động để xóa thông tin cá nhân khỏi dữ liệu đào tạo mô hình Gemma. Ngoài ra, phương pháp học tăng cường, được hướng dẫn bởi phản hồi của con người, đã được sử dụng để tinh chỉnh các biến thể Gemma phù hợp với hướng dẫn, đảm bảo chúng tuân thủ các khuôn mẫu hành vi có trách nhiệm.

Google đề cập rằng bản chất không ngừng phát triển của AI đặt ra những cân nhắc quan trọng về bảo mật và sử dụng có đạo đức, vì nếu rơi vào tay kẻ xấu, việc thiếu các hạn chế đối với các mô hình AI mở có thể tạo ra rủi ro đáng kể cho xã hội. Google nhận ra những thách thức này và đã thực hiện một cách tiếp cận toàn diện để giải quyết chúng thông qua các đánh giá nghiêm ngặt và điều khoản sử dụng rõ ràng. Công ty tìm cách đảm bảo rằng các mô hình AI mở được sử dụng một cách có đạo đức và có trách nhiệm, đồng thời khuyến khích sự đổi mới và cộng tác trong cộng đồng.

Đối với những người quan tâm, bạn nên biết rằng Gemma có hai cấu hình là Gemma 2B và Gemma 7B, mô hình AI nguồn mở này cung cấp các biến thể được đào tạo trước và điều chỉnh theo hướng dẫn để hoạt động hiệu quả. Ngoài ra, giấy phép của Gemma cho phép sử dụng miễn phí trong các dự án nghiên cứu, cá nhân và thương mại cũng như tạo và phân phối các phiên bản sửa đổi của mô hình.

cuối cùng nếu bạn là muốn biết thêm về nó, bạn có thể kiểm tra các chi tiết trong liên kết theo dõi.


Để lại bình luận của bạn

địa chỉ email của bạn sẽ không được công bố. Các trường bắt buộc được đánh dấu bằng *

*

*

  1. Chịu trách nhiệm về dữ liệu: Miguel Ángel Gatón
  2. Mục đích của dữ liệu: Kiểm soát SPAM, quản lý bình luận.
  3. Hợp pháp: Sự đồng ý của bạn
  4. Truyền thông dữ liệu: Dữ liệu sẽ không được thông báo cho các bên thứ ba trừ khi có nghĩa vụ pháp lý.
  5. Lưu trữ dữ liệu: Cơ sở dữ liệu do Occentus Networks (EU) lưu trữ
  6. Quyền: Bất cứ lúc nào bạn có thể giới hạn, khôi phục và xóa thông tin của mình.