IT之家5月28日报道,根据MSPoweruser的说法,Meta在2021年首次使用了微软Azure虚拟机。由于其更快的分布式AI训练,Meta将NVIDIA A100 80GB GPU应用于其大规模AI研究,如训练其OPT-175B语言模型。显然,它可以做得更多,所以Meta决定为其AI研究提供更多的机器学习训练工作量。
“作为这种更深入关系的一部分,Meta将扩大对Azure超级计算能力的使用,以加速其Meta AI团队的人工智能研发,”Azure HPC和AI高级项目经理Sherry Wang指出。“Meta将在Azure中使用最新的虚拟机(VM)系列(NDm A100 v4系列,采用NVIDIA A100 Tensor Core 80GB GPU),5400个GPU的专用Azure集群将用于他们的一些大规模AI研究工作负载azuredevops。”
微软和Meta的合作不止于此。这两家公司还计划在Azure上扩大PyTorch的使用。王表示,微软将创建PyTorch开发加速器,以便在Azure上快速实现基于PyTorch的解决方案。此外,该公司承诺继续提供PyTorch企业级支持,“以metaphor使客户和合作伙伴能够在云和边缘生产环境中部署PyTorch模型。”
Meta人工智能副总裁杰罗姆佩森蒂(Jerome Pesenti)表示,“我们很高兴与Azure加深合作,推动Meta人工智能的研究、创新和开源工作,从而惠及全球更多开发者。”“凭借Ametabolismzure的计算能力和每VM 1.metaphor6 TB/s的互联带宽,我们可以加速不断增长的训练需求,以更好地适应更大、更创新的AI模型azure云服务。此外,我们很高兴与微软合作,将我Meta们的经验扩展到从研究到生产使用PyToazure是什么意思rch的客户。”