来自拉斯维加斯 Cubit 的 Jing Lei |公众号QbitAI从未见过凡尔赛宫如此著名的场景。新产品实在是太多了,云计算老大哥亚马逊云技术首席执行官马特·加曼在年度re:Invent 2025盛典上表示:“我要挑战自己,在10分钟内推出25款产品!”由于这是史无前例的举动,公众立即兴奋不已。 Garman 随后在 24 秒内一次性推出了新的计算、存储、安全、数据库和大数据内容,相当于单一产品。很多朋友可能会问有必要这样赶吗?是不是太幼稚了?要快点,你真的必须快点。但这不是儿戏。因为今年,亚马逊云技术在短短两个多小时内,一共推出了近40款新品。这并不意味着我上面提到的25个元素不重要。之前,它只是意味着上面的新版本更加令人兴奋。来自计算模型、平台和应用程序的强大功能,我们涵盖了当今最流行的人工智能代理,几乎涵盖了您可以想象和使用的所有内容。如果非要用一个词来概括这次会议的整体基调,可能就是“7英寸”,直击使用大规模AI模型和智能体时面临的所有问题。现在让我们看看以前的版本有多重要。 (PS:先剧透一下,中国两大模式被云计算领军者大获全胜命名~) 剧透:新的Trainium4芯片已经是算力帝国了。 AI的本质在于它是一个计算密集型项目,性能、成本以及部署计算能力的灵活性直接决定了企业能走多远。亚马逊云技术他们深知这一点。本次发布会,我们从三个维度完整重构了AI算力供电模型。首先我们来说说自主芯片研究。 Trainium,一个人工亚马逊云技术公司内部开发的智能芯片已从概念产品发展成为价值数十亿美元的业务。据 Garman 称,亚马逊云技术已部署了超过 100 万个 Trainium 芯片,并且生产速度比业界最快的 AI 芯片快四倍。今天,Trainium3 Ultra 服务器正式全面上市。与上一代Trainium2相比,这款基于3nm工艺的服务器计算性能提升了4.4倍,内存带宽提升了3.9倍。更重要的是,在相同的延迟下,每兆瓦电力可以生成五倍多的人工智能代币。此外,还推出了亚马逊云技术的下一代芯片Trainium 4。 Garman表示,与上一代相比,《Trainium 4》在各方面都有巨大的飞跃。 FP4的计算性能提升了6倍,内存带宽提升了4倍,拥有两倍的高带宽和上一代的宽度内存容量。专为满足全球最大的模型培训需求而设计。与亚马逊云技术合作15年的Nvidia也参加了发布会。 Garman 强调,亚马逊云技术是全球最稳定、最可靠的运行 NVIDIA GPU 的云平台。您还可以深入到 BIOS 级别进行调试,这可以防止您的 GPU 意外重启。这是其他云提供商所没有的功能。有鉴于此,亚马逊云技术选择了 NVIDIA 最新的 GB200 NVL72 系统,为客户提供最大的计算能力,尤其是那些使用超大型模型进行训练的客户。我们已经推出了配备此功能的 P6e-GB300 实例。包括 OpenAI 在内的领先人工智能公司在亚马逊云技术上运行由数十万个芯片组成的集群,以支持 ChatGPT 并训练下一代模型。最后,我们要介绍的是AI Factory,这是一个新产品,它可以彻底打破了公有云和私有数据中心之间的界限。这使得客户可以在其数据中心部署专用的亚马逊云技术人工智能基础设施。客户可以无缝访问 Amazon Cloud Technology 的全系列 AI 服务,包括 Trainium、NVIDIA GPU、SageMaker 和 Bedrock,同时回收空间或计算机实验室和现有能源。这意味着拥有自己的计算实验室的大型组织可以在不牺牲安全性和控制力的情况下享受世界一流的人工智能计算能力。从Trainium的自研,到GPU超级集群的运营和维护,再到AI工厂的区域复制,亚马逊对算力供应链的云技术控制力正在接近算力帝国的定义。而且这种类型的领导是完整的:芯片、网络、数据中心、一致的API、模型托管、代理运行环境。每一层都形成自己的屏障。还推出了一款新车型推出并命名了国家模型。如果说算力是土壤,那么大规模模型就可以比作这里生长的种子。技术解决方案亚马逊在这个层面的云战略是打造Amazon Bedrock,一个开放、灵活、可深度定制的建模平台。 Bedrock 的核心理念是“一种模型无法统治所有模型”。这就是亚马逊云技术不断通过新的和更大的模型进行扩展的原因。原因如下。除了Google的Gemma、NVIDIA的Nemotron等业界知名模型外,本次发布会还有一点特别值得一提。这是中国的KimiMiniMax首次纳入Bedrock。这意味着中国大模式通过全球最大的云平台亚马逊云技术正式进军海外市场,进入全球开发者的视野。基于这个生态系统,亚马逊云科技还推出了全新自主研发的大型云服务。odel,亚马逊 Nova 2 系列。总体来说,与 Amazon Nova 2 不同的是三种类型。 Nova 2 Light:主打高成本、低延迟的性能,在执行指令、调用工具、生成代码、从文档中提取信息等关键任务上,其性能可与 Claude Haiku、G 相媲美。它匹配或超过PT-4o-mini和Gemini Flash等行业基准,并且成本更加优惠。 Nova 2 Pro:对于非常复杂的任务,在需要深度推理和精确使用工具的场景中效果特别好,例如创建高级代理。 Garman 声称它在多个 AI 分析基准测试中优于 GPT-5.1、Gemini 3 Pro 和 Claude 4.5 Sonnet。 Nova 2 Sonic:专注于实时类人语音对话交互,显着优化延迟,支持更广泛的语言。如果说 Nova 2 解决了丰富性和速度的问题,那么 Nova 2 Omni 解决了融合问题。它是业界首个集成推理模型,支持文本、图像、视频和音频四种模态输入,并可输出文本和图像。这意味着模型可以理解整个会议,包括主题演讲、PPT 和演示视频,并自动生成带有图像和文本的摘要报告。自然,这种多模态融合能力使我们能够真正理解复杂的现实世界。这是形成理解代理的基本步骤。然而,所有这些流行模式的主要障碍是缺乏对业务的了解。数据、流程和行业知识是您竞争优势的核心。为了实现这一目标,亚马逊云技术找到了一张王牌。 Amazon Nova ForgeNova Forge 引入了开放训练模型的概念。这使得企业客户能够在多个训练阶段控制 Nova 模型,并将您的私有数据(例如产品设计文档、故障案例和制造约束)与常见的亚马逊云技术训练数据集。这样,就可以训练出一个专门的模型(Novella),它不仅保留强大的一般推理能力,而且对公司特定的知识有深刻的理解。 Reddit 的例子清楚地说明了所涉及的价值。 Reddit 成功训练了一个独特的模型,该模型可以通过在预训练阶段结合社区特定的内容安全数据来准确识别非法内容。这不仅满足了准确性目标,还大大简化了部署和操作。这有效解决了传统调优中灾难性模型遗忘的问题,让企业拥有自己的专家AI,在行业中真正独一无二。代理,代理,必须是代理! AI Agent 绝对是本次 re:Invent 的关键词之一。亚马逊云技术也非常重视这一点,并为此投入了大部分空间。加曼澄清:AI助手时代正在被AI取代代理。未来,每家公司都将与数十亿代理商进行运营。但如果公司真的想充分利用这些人工智能代理,他们需要解决两个大问题。如何高效创建代理?其行动是可控的,其结果是可信的。我如何确定它是值得信赖的?为此,Amazon Cloud Technology 使用了一个示例。在开发者层面,Garman 首先为 Kiro 编程助手发布了三个新代理。第一个是自主特工 Kiro。它不再只是一个代码补全工具,现在它充当一个“虚拟同事”,可以长时间运行、独立规划、并行执行复杂的开发任务。例如,如果需要更新一个由15个微服务共享的密钥库,传统方法需要开发人员与商店一一交互。 Kiro Autonomous Agent 自动分析所有依赖关系并生成 15 个经过充分测试的拉取请求,可以直接合并。记住开发人员的反馈,并在后续任务中不断学习和改进。接下来是 AWS 安全代理。您可以将安全更改发挥到极致,积极审查设计文档,在提交代码时搜索漏洞(拉取请求),并按需启动一键渗透测试。这个代理改变了以前昂贵、不频繁、耗时的安全审计。在开发过程中花费了大量时间在实时、频繁、自动化的链接上。最后,还有 AWS DevOps Agent,这是一个 24/7 在线的超级 SRE。当系统警报发生时,我们深入了解您的应用程序拓扑和部署流程,以快速识别根本原因(例如CDK代码错误导致的Lambda IAM策略问题),提供修复建议,甚至建议预防措施以防止问题再次发生。这三个代理覆盖了整个软件开发生命周期,解放了开发人员从重复、艰苦且容易出错的体力工作中解脱出来,让他们能够专注于更高价值的创造性工作。据内部资料显示,一个六人团队最初使用 Kiro 在短短 76 天内完成了一个需要 30 人、18 个月的架构重组项目(据说他重写了 Bedrock)。当然,并不是每个公司都能从头开始创建代理。为此,亚马逊云技术提供了强大的平台功能AWS Transform Custom,帮助企业消除技术债务。开发人员可以创建自定义代码转换代理,以自动将遗留代码、框架和 API(甚至专有的)迁移到现代平台。我们的客户 QAD 使用此方法减少了原本需要两周到三天的迁移工作。 AgentCore策略是解决代理失控问题的关键。这使得管理员可以用自然语言定义策略,例如“禁止向退款金额超过 $ 的客户退款”这些策略被翻译成安全的Cedar策略语言,每次代理尝试调用工具或访问数据时,都会以毫秒级执行实时验证。这就像设置了一个无法绕过的电子围栏,允许强大的攻击。虽然它们是自治的,但行为的限制是清晰可控的。AgentCore评估解决了代理不可信的问题。传统上,评估代理输出的质量(例如,准确性、 AgentCore Evaluates 需要专门的数据科学团队来创建复杂的评估流程,从而提供 13 个预构建的评估程序,并将评估结果直接集成到 CloudWatch 中,并确保其性能始终符合预期。ifecycle,从构建和部署到治理和评估,使企业能够主动使用和利用其代理。我会让它发生。目标非常明确。重点在于如何很好地“使用”它们。回顾整个发布会,亚马逊在大规模AI模型和代理时代的发展路径其实非常清晰和简单。也就是如何用好它们。即使日程推迟两年,策略也是一样的。从一开始,我们就没有太深入地研究大规模模型,而是坚持底层架构和应用。用亚马逊云技术本身的话说:“我们做客户需要的事情。”实施问题和计算成本?利用我们内部开发的 Trainium 芯片、与 NVIDIA 的深度集成以及创新的 Factory.AI 来解决您的问题。您的模型无法理解您公司的私有知识吗?用Bedrock开放生态解决问题,强大Nova 系列和创新的 Nova Forge。您的代理是否无法控制、不可靠且难以创建?使用 Kiro 的工具集解决您的问题,包括下一代代理、转换自定义、策略和评估。这三个架构层构成了一系列联合打击,直接影响人工智能价值的“7英寸”。它传达的中心信息也非常明确。人工智能的未来不在于单一的技术进步,而在于一整套安全、可靠、可扩展的端到端、企业级基础设施。正如索尼和 Adobe 在主题演讲中所分享的那样,真正的转型成功来自于将数据和应用程序深度集成到云平台中,从而赋予他们面对不确定性的敏捷性和弹性。正如加曼在发布会上所说,这可能是人工智能从“技术时代”到人工智能“价值时代”的转折点。还有一件事:今年有 60,000 名来自世界各地的人来到拉斯维加斯参加 re:Invent。今天主论坛上大家都很兴奋。让我们来感受一下这种感觉U:你错过了今天re:Invent的有趣内容吗?不用担心。亚马逊云技术re:Invent中国巡演即将开始。通过4城巡演+北京总部直播,无论您是云计算新手还是技术老手,都可以从高水平的主题演讲、实用的内容、技术分享和专家交流中受益。立即注册以确保您的席位并获得 Agen!tic 人工智能时代的新机会! https://events.amazoncloud.cn/reinvent-online-20251218?trk=811631fa-539a-41c3-8fed-f23e4f9919dc sc_channel=el
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由社交媒体网易号用户上传发布仅提供信息存储服务的edia平台。