Gemma:Google基於 Gemini 的 AI 模型,現已開源

芽

Gemma,一種新的開源人工智慧模型

谷歌宣布, 透過一篇部落格文章,推出了他的 基於 Gemini 聊天機器人的新人工智慧模型系列“Gemma”«。這是一種機器學習模型,基於 Google 聊天機器人模型 Gemini 使用的技術構建,並提供 2 到 7 億個參數的一系列變體,專為不同的應用程式和硬體要求而設計。

Gemma 旨在提供 給開發者 用於創建人工智慧應用程式的高級工具 Gemma 的應用領域涵蓋了從對話系統和虛擬助理的創建到文本生成、自然語言問題回答、內容摘要、文本修正和語言學習支援。此外,該模型還允許操作各種類型的文字數據,包括詩歌、程式碼、文字重寫和使用模板生成字母。

Gemma 的一個亮點是她相對較小的尺寸,這有利於 它在資源有限的硬體上的實現, 例如標準筆記型電腦和個人電腦。在 Huggingface 和 Google 進行的比較中,Gemma-7B 模型表現出了穩定的性能,在 Huggingface 的比較中排名第二,僅次於 LLama 2 70B Chat 模型。在 Google 比較中,Gemma-7B 略領先 LLama 2 7B/13B 和 Mistral-7B。

在一部分 工具和框架的生態系統, 新的人工智慧聊天機器人 提供集成 開發人員常用的大量工具,因為它有幾個重要的專案已經整合了與 Gemma 的支持,並且在已經獲得支援的專案中,以下專案脫穎而出: Hugging Face、MaxText、NVIDIA NeMo、TensorRT-LLM、Transformers、Responsible Generative AI Toolkit 等。

此外,Google還發布了一個名為gemma.cpp的獨立輸出引擎,用C++編寫,專門針對Gemma,並且llama.cpp引擎中添加了對Gemma的支援。為了優化模型,開發人員可以利用 Keras 框架以及 TensorFlow、JAX 和 PyTorch 的後端。

重要的是要注意 Gemma模型的規模為8個代幣,這限制了它在文本生成過程中可以處理和記住的資訊量(作為比較,Gemini 和 GPT-4 等模型的上下文大小為 32 個標記,GPT-4 Turbo 有 128 個)。此外,Gemma 模型目前僅支援英語作為語言。

為了確保最高的安全標準, 谷歌使用自動化技術從數據中刪除個人信息 Gemma 模型的訓練。 此外,在人類回饋的指導下,強化學習被用來根據指令完善 Gemma 變體,確保它們遵守負責任的行為模式。

谷歌提到,人工智慧不斷發展的性質引發了對安全和道德使用的重要考慮,因為如果落入壞人之手,開放人工智慧模型缺乏限制可能會給社會帶來重大風險。谷歌認識到這些挑戰,並採取了全面的方法透過嚴格的評估和明確的使用條款來解決這些問題,該公司力求確保開放人工智慧模型的使用符合道德和負責任,同時鼓勵社區的創新和協作。

對於有興趣的人,你應該知道 Gemma 有兩種設定:Gemma 2B 和 Gemma 7B,這個開源人工智慧模型提供了經過指令預訓練和調整的變體,以實現高效運行。此外,Gemma 的授權允許在研究、個人和商業專案中免費使用,以及模型修改版本的建立和分發。

最後,如果你是 有興趣了解更多,您可以在中查看詳細信息 以下鏈接。


發表您的評論

您的電子郵件地址將不會被發表。 必填字段標有 *

*

*

  1. 負責數據:MiguelÁngelGatón
  2. 數據用途:控制垃圾郵件,註釋管理。
  3. 合法性:您的同意
  4. 數據通訊:除非有法律義務,否則不會將數據傳達給第三方。
  5. 數據存儲:Occentus Networks(EU)託管的數據庫
  6. 權利:您可以隨時限制,恢復和刪除您的信息。