有 " 云计算春晚 " 之称、为期四天的 "re:Invent" 在美国拉斯维加斯盛大开启。周二,亚马逊与其云计算部门 AWS 都各自公布了重磅消息。
在 AWS 这边,其发布了升级版的自研处理器芯片 "Graviton4"。新闻稿称,与上一代 Graviton3 相比,其计算性能提高了 30%,内核增加了 50%,内存带宽增加了 75%,为在亚马逊 EC2 中运行的云工作负载提供最佳的性价比和能效。
Graviton4 和 TrainiumAWS 还发布了面向人工智能系统的升级款加速器芯片 "Trainium2"。介绍称,其训练速度是上一代 Trainium1 的四倍,并且能够组合在超过 10 万个芯片的 EC2 UltraCluster 中," 使基础模型(FM)和大型语言模型(LLM)的训练只需极少的时间,同时能效将提升至 2 倍。"
据了解,Trainium2 将于 2024 年投入应用,可能取代 AWS 中部分英伟达的 AI 加速器产品,但这不意味着亚马逊和英伟达分道扬镳。在会议上,英伟达 CEO 黄仁勋和 AWS CEO Adam Selipsky 一起上台,宣布两家公司 " 扩大战略合作关系 "。
最新的合作包括,AWS 将成为第一家采用英伟达 GH200 Grace Hopper Superchip 平台的云服务提供商,该平台可以集成 32 个 Grace Hopper 超级芯片在一个封装 "GH200 NVL32" 中。配备亚马逊云技术后,服务可以扩展到数千个 GH200 芯片。另外,两家公司将合作在 AWS 上托管英伟达的多节点 AI 训练即服务解决方案 "NVIDIA DGX 云 ",它也将成为第一个采用 GH200 NVL32 的 DGX 云。两者还在 Ceiba 项目上进行合作,设计全球最快的、GPU 驱动的 AI 超级计算机,英伟达计划使用它来推动下一波生成式 AI 的创新。
AWS 还将推出三个新的 Amazon EC2 实例,分别为 P5e、G6 和 G6e,三者都将由英伟达的 GPU 提供支持。其中,G6e 特别适合使用英伟达的平台 "NVIDIA Omniverse" 来开发 3D 工作流程、构建数字孪生和其他应用程序。
除此以外,AWS CEO Adam Selipsky 还发布了一款名为 "Q" 的聊天机器人,专门供人们在工作中使用,并且可以根据客户的业务进行定制。新闻稿称,用户可以使用 Q 在 AWS 上构建应用程序、研究最佳实例、解决错误以及获得编写新功能的帮助。