马斯克再发Grok-1.5，128K代码击败GPT-4

42 0 0

开源仅11天后，马斯克再次发布了Grok模型的升级版本——Grok-1.5。 该模型在推理能力、数学和代码能力方面都有显著提升，并能够处理长达128K token的文本，展现出强大的长语境理解能力。

Grok-1.5的改进主要体现在以下几个方面：

推理能力大幅提升： Grok-1.5的上下文长度扩展到128K，使其能够利用更长的文档信息进行推理和解决问题。在数学基准测试中，Grok-1.5的得分提高了26.7%，在代码生成和解决问题能力评估中，其得分也达到了74.1%。
数学和代码能力增强： Grok-1.5在数学和代码相关任务中的表现尤为突出。在GSM8K数学基准测试中，Grok-1.5的得分达到了90%，在MATH数学基准测试中，其得分也达到了50.6%。这表明Grok-1.5能够更好地理解和处理数学和代码问题。
长语境理解能力增强： Grok-1.5能够处理长达128K token的文本，这使其能够理解更长的文档和更复杂的语义。在Needle In A Haystack（NIAH）评估中，Grok-1.5取得了完美的检索结果，表明其具有强大的长语境理解能力。

Grok-1.5的发布再次展现了xAI团队在AI领域的快速迭代能力。 在短短11天内，xAI团队就对Grok模型进行了重大升级，并将其开源，这将推动AI技术的发展和进步。

以下是Grok-1.5的一些亮点：