微软Ignite 2024:Azure数据中心新芯片发布

微软Ignite 2024:Azure数据中心新芯片发布

在推出自主研发的 AI 加速器和 CPU 一年后,微软宣布将在其Azure数据中心中部署两款新定制芯片,以提升云服务的性能和安全性。该消息于 11 月 19 日公布。

在芝加哥举行的 Microsoft Ignite 大会上,这家科技巨头发布了 Azure 集成硬件安全模块 (HSM),这是其最新的自主研发云安全芯片。该芯片强化了密钥管理功能,使加密和签名密钥可以始终保留在芯片内。

微软还推出了 Azure Boost DPU,这是公司首款自主研发的数据处理单元。该单元可卸载网络和存储管理任务,并集成数据加速器和安全功能,从而减轻 CPU 的负载。

“对于终端用户而言,这意味着应用程序和操作环境更加安全,同时运行速度更快,”Moor Insights & Strategy 的副总裁兼首席分析师 Matt Kimball 表示。

通过这两款新芯片,微软继续优化其基础设施和环境,以满足客户对 AI、分析及其他数据驱动需求的要求,Kimball 补充道。

微软Ignite 2024:Azure数据中心新芯片发布

Azure集成硬件安全模块(HSM)是该公司最新的内部云安全芯片(图片来源:Microsoft)

超大规模云服务提供商押注定制芯片

在去年的 Ignite 大会上,微软推出了 Azure Maia AI 加速器,用于云端的 AI 训练和推理工作负载,以及基于 Arm 架构的 Cobalt 100 CPU,该 CPU 能耗低,适用于通用工作负载并提供出色的性能功耗比。

2024 年初,微软正式推出了这两款处理器,为其服务(如 Microsoft Copilot 和 Azure OpenAI Service)提供支持。今年 10 月,Azure 宣布基于 Cobalt 100 的虚拟机正式向客户开放。

包括 Azure 在内的超大规模云服务提供商,如 Amazon Web Services (AWS)、Google Cloud 和 Meta,发现开发定制芯片来支持自己的数据中心和云服务对客户既具有成本效益,也更具优势。然而,这些云提供商仍与英伟达 (Nvidia)、AMD 和英特尔 (Intel) 等大型芯片制造商保持合作关系。

在本次 Ignite 大会上,微软宣布将推出新云服务,这些服务将由英伟达下一代 Blackwell GPU 和定制版 AMD Epyc 处理器提供支持。

Azure 的 AI 超级计算机与 HPC 云服务

微软宣布正在上线一项 AI 超级计算云服务,该服务由英伟达的 AI 系统和 GB200 Grace Blackwell Superchip 支持。

具体而言,微软表示,这项名为 Azure ND GB200 v6 的云服务将提供 AI 优化的虚拟机。这些虚拟机结合了英伟达 GB200 NVL 的 72 架构设计和 Quantum InfiniBand 网络,将成千上万的 Blackwell GPU 连接起来,为客户提供 AI 超级计算性能。

微软称,系统已逐步上线,并正在与英伟达和其他合作伙伴进行协同验证和优化。虽然此次只是 Blackwell 支持的云服务预览版,但分析师认为这表明 Blackwell GPU 即将上市。

“每家公司都在尝试推出基于 Blackwell 的服务。与上一代相比,这代表了性能的显著提升,”Tirias Research 的首席分析师兼合伙人 Jim McGregor 表示。

微软还宣布了一个全新高性能计算 (HPC) 云服务,该服务将由定制版 AMD Epyc 9V64H 处理器支持,且仅在 Azure 上可用。

这一基于 Zen4 内核的定制 AMD 芯片配备高带宽内存,其性能比其他裸机和云替代方案高出 8 倍,且比传统本地系统快 35 倍,微软表示。新的 Azure HBv5 虚拟机将在 2025 年开放预览。

Kimball 表示,该定制 AMD 芯片专为满足 Azure 独特的功耗和性能要求而设计。然而,为云提供商定制芯片的做法并不罕见。例如,英特尔为 AWS 开发了定制芯片。实际上,两家公司最近宣布了一项新的多年度、数十亿美元的合作协议,英特尔将为 AWS 生产一款定制 AI 布局芯片和定制 Xeon 6 芯片。

McGregor 指出,为云服务提供商定制芯片是一个正在增长的趋势,并将在未来几年持续下去。

关于 Azure 新安全芯片和 DPU 的更多细节

微软表示,将从 2025 年起在其数据中心的每台新服务器上安装 Azure 集成 HSM 安全芯片。

Kimball 指出,Azure 集成 HSM 可与整个 Azure 安全堆栈协作,提供全面的端到端安全性。此前,Azure 开发了另外两款安全芯片:Project Cerebrus(提供可信根,确保安全启动环境)和 Azure Security Services(负责认证和证明,确保硬件及相关软件如驱动程序的真实性和未被篡改)。

“新款 HSM 安全芯片用于管理加密功能,并将其绑定在一个安全的可信环境中,”Kimball 表示。

AWS 和 Google Cloud 也开发了自有的安全芯片。AWS 的 Nitro Security Chip 和 Google Cloud 的 Titan 功能范围各异,但其核心概念相同:为数百万用户提供一个完全安全的操作和数据环境。

对于 Azure Boost DPU,微软预计其 DPU 服务器运行云存储工作负载时的功耗降低三倍,性能提升四倍。

McGregor 指出,使用 DPU 对用户来说有很大优势。

“网络和存储卸载功能能提升服务器的效率。因此,Azure 云上运行的 GPU 和 CPU 任务效率将大幅提高,”他补充道。

Azure Local 替代 Azure Stack HCI

此外,微软宣布推出新的 Azure Local 基础设施解决方案,取代原有的 Azure Stack 产品线。

Azure Stack HCI(超融合基础设施)设备是一种本地硬件,允许企业在内部运行工作负载,同时连接 Azure 云服务。

微软表示,Azure Local 是一个由 Azure Arc 启用的云控制混合基础设施平台,能够将本地环境连接到 Azure 云。现有的 Azure Stack HCI 客户将自动升级到 Azure Local。

在人工智能领域,微软宣布 Azure AI Foundry 增加了新功能,企业可以在其中设计、定制和管理 AI 应用和代理。

微软称,新的功能包括目前处于预览状态的 Azure AI Foundry SDK。该 SDK 提供了统一的工具链,用于定制、测试、部署和管理 AI 应用和代理。

未经允许不得转载:A5数据 » 微软Ignite 2024:Azure数据中心新芯片发布

相关文章

contact