Gemma:谷歌基于 Gemini 的 AI 模型,现已开源

芽

Gemma,一种新的开源人工智能模型

谷歌宣布, 通过一篇博客文章,推出了他的 基于 Gemini 聊天机器人的新人工智能模型系列“Gemma”«。这是一种机器学习模型,基于 Google 聊天机器人模型 Gemini 使用的技术构建,并提供 2 到 7 亿个参数的一系列变体,专为不同的应用程序和硬件要求而设计。

Gemma 旨在提供 给开发者 用于创建人工智能应用程序的高级工具 Gemma 的应用领域涵盖了从对话系统和虚拟助手的创建到文本生成、自然语言问题回答、内容摘要、文本修正和语言学习支持。此外,该模型还允许操作各种类型的文本数据,包括诗歌、编程代码、文本重写和使用模板生成字母。

Gemma 的一个亮点是她相对较小的尺寸,这有利于 它在资源有限的硬件上的实现, 例如标准笔记本电脑和个人电脑。在 Huggingface 和 Google 进行的比较中,Gemma-7B 模型表现出了稳定的性能,在 Huggingface 的比较中排名第二,仅次于 LLama 2 70B Chat 模型。在 Google 比较中,Gemma-7B 略领先于 LLama 2 7B/13B 和 Mistral-7B。

在一部分 工具和框架的生态系统, 新的人工智能聊天机器人 提供集成 开发人员常用的大量工具,因为它有几个重要的项目已经集成了与 Gemma 合作的支持,并且在已经支持的项目中,以下项目脱颖而出: Hugging Face、MaxText、NVIDIA NeMo、TensorRT-LLM、Transformers、Responsible Generative AI Toolkit 等。

此外,Google还发布了一个名为gemma.cpp的独立输出引擎,用C++编写,专门针对Gemma,并且llama.cpp引擎中添加了对Gemma的支持。为了优化模型,开发人员可以利用 Keras 框架以及 TensorFlow、JAX 和 PyTorch 的后端。

重要的是要注意 Gemma模型的规模为8个代币,这限制了它在文本生成过程中可以处理和记住的信息量(作为比较,Gemini 和 GPT-4 等模型的上下文大小为 32 个标记,GPT-4 Turbo 有 128 个)。此外,Gemma 模型目前仅支持英语作为语言。

为了确保最高的安全标准, 谷歌使用自动化技术从数据中删除个人信息 Gemma 模型的训练。 此外,在人类反馈的指导下,强化学习被用来根据指令完善 Gemma 变体,确保它们遵守负责任的行为模式。

谷歌提到,人工智能不断发展的性质引发了对安全和道德使用的重要考虑,因为如果落入坏人之手,开放人工智能模型缺乏限制可能会给社会带来重大风险。谷歌认识到这些挑战,并采取了全面的方法通过严格的评估和明确的使用条款来解决这些问题,该公司力求确保开放人工智能模型的使用符合道德和负责任,同时鼓励社区的创新和协作。

对于感兴趣的人,你应该知道 Gemma 有两种配置:Gemma 2B 和 Gemma 7B,这个开源人工智能模型提供了经过指令预训练和调整的变体,以实现高效运行。此外,Gemma 的许可证允许在研究、个人和商业项目中免费使用,以及模型修改版本的创建和分发。

最后,如果你是 有兴趣了解更多,您可以在中查看详细信息 以下链接。


发表您的评论

您的电子邮件地址将不会被发表。 必填字段标有 *

*

*

  1. 负责数据:MiguelÁngelGatón
  2. 数据用途:控制垃圾邮件,注释管理。
  3. 合法性:您的同意
  4. 数据通讯:除非有法律义务,否则不会将数据传达给第三方。
  5. 数据存储:Occentus Networks(EU)托管的数据库
  6. 权利:您可以随时限制,恢复和删除您的信息。