亚马逊“云计算春晚”大爆猛料：采用 GH200 超级芯片、发布聊天机器人

有 " 云计算春晚 " 之称、为期四天的 "re:Invent" 在美国拉斯维加斯盛大开启。周二，亚马逊与其云计算部门 AWS 都各自公布了重磅消息。

在 AWS 这边，其发布了升级版的自研处理器芯片 "Graviton4"。新闻稿称，与上一代 Graviton3 相比，其计算性能提高了 30%，内核增加了 50%，内存带宽增加了 75%，为在亚马逊 EC2 中运行的云工作负载提供最佳的性价比和能效。

亚马逊“云计算春晚”大爆猛料：采用 GH200 超级芯片、发布聊天机器人-云投网

Graviton4 和 TrainiumAWS 还发布了面向人工智能系统的升级款加速器芯片 "Trainium2"。介绍称，其训练速度是上一代 Trainium1 的四倍，并且能够组合在超过 10 万个芯片的 EC2 UltraCluster 中，" 使基础模型（FM）和大型语言模型（LLM）的训练只需极少的时间，同时能效将提升至 2 倍。"

据了解，Trainium2 将于 2024 年投入应用，可能取代 AWS 中部分英伟达的 AI 加速器产品，但这不意味着亚马逊和英伟达分道扬镳。在会议上，英伟达 CEO 黄仁勋和 AWS CEO Adam Selipsky 一起上台，宣布两家公司 " 扩大战略合作关系 "。

最新的合作包括，AWS 将成为第一家采用英伟达 GH200 Grace Hopper Superchip 平台的云服务提供商，该平台可以集成 32 个 Grace Hopper 超级芯片在一个封装 "GH200 NVL32" 中。配备亚马逊云技术后，服务可以扩展到数千个 GH200 芯片。另外，两家公司将合作在 AWS 上托管英伟达的多节点 AI 训练即服务解决方案 "NVIDIA DGX 云 "，它也将成为第一个采用 GH200 NVL32 的 DGX 云。两者还在 Ceiba 项目上进行合作，设计全球最快的、GPU 驱动的 AI 超级计算机，英伟达计划使用它来推动下一波生成式 AI 的创新。

AWS 还将推出三个新的 Amazon EC2 实例，分别为 P5e、G6 和 G6e，三者都将由英伟达的 GPU 提供支持。其中，G6e 特别适合使用英伟达的平台 "NVIDIA Omniverse" 来开发 3D 工作流程、构建数字孪生和其他应用程序。

除此以外，AWS CEO Adam Selipsky 还发布了一款名为 "Q" 的聊天机器人，专门供人们在工作中使用，并且可以根据客户的业务进行定制。新闻稿称，用户可以使用 Q 在 AWS 上构建应用程序、研究最佳实例、解决错误以及获得编写新功能的帮助。

亚马逊“云计算春晚”大爆猛料：采用 GH200 超级芯片、发布聊天机器人

24小时排行