本周AI界大事件一览:关键技术更新与行业动态
疯狂星期二:谷歌、OpenAI与Mistral的大更新
4月9日,在被业界称为“疯狂星期二”的一天里,谷歌、OpenAI和Mistral AI接连发布了各自的大模型更新。谷歌推出了Gemini 1.5 Pro的示意图更新,特别是音频视频处理能力的显着提升,这使得该平台能够处理长达11小时的音频或1小时的视频。值得注意的是谷歌在企业AI解决方案领域的进一步研究。
紧随其后,OpenAI发布了非预览版的GPT-4 Turbo,将之前的GPT-4 Vision功能直接整合到模型中,这意味着用户可以通过图像单一的API调用来进行分析和应用推理,进一步增强了模型的实用性和便捷性。
同时,被称为“欧洲版OpenAI”的Mistral AI也不甘落后,开源了其大模型Mixtral8x22B,该模型的参数规模高达1760亿,解决了AI公司的Grok-1大模型。
苹果与英特尔的新动向
苹果公司预计将在9月推出搭载AI功能的新版Mac,这一动向旨在提振其电脑业务。新款Mac将配备M4芯片,这将是苹果产品线的一次重大刷新,着眼于苹果在集成AI技术方面迈出了新的步伐。
同时,在英特尔其Vision大会上发布了新一代Gaudi 3 AI芯片。与竞争对手英伟达的H100相比,Gaudi 3的性能训练提高了170%,推理能力提高了50%,更高的效率和市场上的价格报价相对较上。
AI行业的其他重要动态
Meta宣布推出其第二代自研AI训练和推理芯片MTIA v2,旨在进一步减少对英伟达等芯片制造商的依赖。这表明Meta在自主研发核心技术方面的决心。
在人力资源方面,AI界的重量级人物吴恩达加入了亚马逊董事会,这一建议从4月9日开始生效。吴恩达的加盟无疑将为亚马逊在AI领域的进一步发展增添强大的推动力。
此外,OpenAI 召集了两名核心团队成员,这一事件引发了该机构在内部管理和信息安全方面的挑战。
前沿研究与新技术应用
北京大学与字节跳动的合作研究提出了新一代视觉自回归建模模式VAR,这种新方法为图像处理提供了从粗到细的递进式学习方法,有望在视觉感知和图像创作领域带来革命性的改变。
在产品创新方面,一款名为Udio的AI音乐生成工具新近上线,该工具支持多语言和多风格的音乐创作,展示了AI在艺术创作领域的潜力。
总结
本周的AI领域见证了重大技术更新和行业动态,从大模型的发布到新芯片的上市,再到前沿研究的成果,各大公司和研究机构在推动人工智能技术的边界上不断努力随着这些技术的进一步发展和应用,我们可以期待AI将在更多领域发挥其变革性的力量。