马斯克大模型Grok宣布开源

人工智能

2024-03-27 16:33:21 工信部信专委专家

当地时间17日，美国知名企业家埃隆·马斯克旗下的人工智能初创公司xAI的大模型Grok-1正式宣布开源。

据xAI官网的介绍称，Grok-1是拥有3140亿参数的模型，是“迄今为止全球参数量最大的开源大语言模型”。相比之下，公开资料显示，OpenAI GPT-3.5的参数量为1750亿。

Grok-1是一个混合专家（Mixture-of-Experts，MOE）大模型，这种MOE架构重点在于提高大模型的训练和推理效率，形象地理解，MOE就像把各个领域的“专家”集合到了一起，遇到任务派发给不同领域的专家，最后汇总结论，提升效率。决定每个专家做什么的是被称为“门控网络”的机制。

xAI已经将Grok-1的权重和架构在GitHub上开源。

GitHub地址： https://github.com/xai-org/grok-1?tab=readme-ov-file

目前Grok-1的源权重数据大小大约为300GB。

Grok-1是马斯克xAI自2023年7月12日成立以来发布的首个自研大模型。xAI特别强调说这是他们自己从头训练的大模型。Grok-1没有针对特定应用进行微调。

xAI是马斯克去年刚刚成立的明星AI创企，其目的之一就是与OpenAI、谷歌、微软等对手在大模型领域进行竞争，其团队来自OpenAI、谷歌DeepMind、谷歌研究院、微软研究院等诸多知名企业和研究机构。

此前马斯克刚刚“怒喷”OpenAI不够“Open”，后脚这就开源了自家的顶级3410亿参数自研大模型Grok-1。虽然马斯克在预热到发布的过程中也“放了几次鸽子”，但最终他并没有食言。

今天，xAI还公布了Grok-1的更多细节：

基础模型基于大量文本数据训练，未针对特定任务进行微调。

3140亿参数的Mixture-of-Experts模型，其对于每个token，活跃权重比例为25%。

xAI从2023年10月开始使用自定义训练堆栈在JAX和Rust之上从头开始训练。

但此次xAI并没有放出Grok-1的具体测试成绩，其与OpenAI即将发布的GPT-5的大模型王者之战，必将成为业内关注的焦点。

美国《纽约时报》报道称，马斯克这一举动，势必加剧人工智能未来的竞争。

Grok开源利弊何在引发业内关注

Grok开源仍立即引发了“开源”和“不开源”之争，成为业内关注的焦点。xAI正式宣布开源的当天，马斯克还在社交媒体上讽刺OpenAI称，“告诉我们OpenAI到底Open（开源）在哪里了”。

《纽约时报》报道称，所谓的开源，也就是将代码开放给所有人查看和使用，马斯克由此进一步介入了人工智能领域的一场激烈辩论。那么，开源是否有助于技术开发，还是只会让它更容易被滥用呢？

澳大利亚阳光海岸大学讲师达拉纳数字联合创始人卡伦·萨瑟兰：业内对此的反应很复杂，新的技术总是一把双刃剑。有一些开发者赞赏Grok开源的行为，他们认为这更加透明，其他开发者能用Grok开发自己的人工智能工具；但是这样做也有风险，Grok可能会被人利用开发很多能造成恶劣影响的人工智能工具，比如制造散布错误信息、虚假信息，这将带来很大坏处。

对于Grok开源，周鸿祎第一时间做了回应：

马斯克开源大模型Grok，打脸山姆奥特曼，周鸿祎告诉我们开源是非常有意义的，他可以成就更多的企业，而马斯克的Grok也需要更多的开发者一起去创造，去一起打造更加完美的Grok；但这并不意味着马斯克开源Grok大模型我们可以“抄”了? 他还评价说：伊隆马斯克果然是个汉子，说到做到前几天说要开源Grok，果然就开源了。

周鸿祎还阐述了一个更重要的观点：开源的意义远不止于此，对于国内的大模型开发团队而言，这无疑是一个巨大的利好。因此，我一直积极倡导开源，这样我们就可以避免重复造轮子，站在巨人的肩膀上，更好地理解和掌握这些先进技术。

马斯克引领开源AI新时代：Grok大模型引领变革浪潮

马斯克通过开源Grok模型，不仅展示了其对AI未来发展前景的信心，还为全行业的繁荣迈出了革命性的一步。开源的初衷在于共享与合作，让全球的开发者、研究者和企业能在这个平台上共同探索、创新和进步。这一开放精神不仅推动了技术的边界，还促进了全球范围内的人才流动与技术交流，为人工智能的未来发展注入了新的活力。