据报道,Meta 最早可能在下周发布其大型语言模型Llama 3的下一个版本。
The Information称 Llama 3 的小版本将提前发布,完整的开源模型仍将在 7 月份发布,并且能够与Claude 3和 GPT-4 竞争。
Instagram 所有者正花费数十亿美元构建先进的人工智能系统,包括从 Nvidia 购买数十万个 H100 GPU 来训练 Llama 和其他模型。
Llama 3 是一个大型语言模型,有多种尺寸,从非常小的模型(可与 Claude Haiku 或Gemini Nano竞争),到更大的完全响应和推理能力的模型(如 GPT-4 或 Claude Opus)。
人们对 Llama 3 知之甚少,除了它预计将像其前身一样开源,并且可能是多模式的,能够理解视觉和文本输入。
Llama 3 可能会有一系列版本和大小,小到 70 亿个参数,大到超过 1000 亿个参数。这仍然小于用于训练 GPT-4 的数万亿参数。
免责声明:本文由用户上传,如有侵权请联系删除!