微软CEO Satya Nadella :计算能力现在每 6 个月翻一番 微软正在使用 AI 构建 AI

微软CEO Satya Nadella 伦敦巡讲

Satya Nadella 和 Jared Spataro 分享了有关 Copilot 和代理的新消息,展示了代理如何作为人工智能驱动的世界的新应用程序。 在本次主题演讲中,微软宣布了新的代理功能。

背景:

技术进步:

AI在现实中的应用:

Copilot平台及AI技术栈:

使用 AI 构建 AI 工具

微软首席执行官 Satya Nadella 表示,AI 开发正在通过 OpenAI 的 o1 模型进行优化,并已进入递归阶段:“我们正在使用 AI 构建 AI 工具,以构建更好的 AI”

Copilot在企业中的应用与影响:

公共部门中的AI应用:

未来展望:

信任与安全:


萨提亚·纳德拉演讲稿

早上好,能够回到伦敦和英国,尤其是在这样的一个时刻,感到非常兴奋。此时此刻,正有一个新的科技平台诞生,能够在英国讨论它并看到它的影响,这让人倍感激动。实际上,我今早刚刚回顾,微软在英国已经有四十年的历史,而我自己过去三十年里也一直在造访这个国家。 我第一次来到这里时,实际上是在90年代初期,我并没有做主旨演讲,而是参加了一个分会场,当时我做的是Excel的演示,这真是令人着迷。

我来到这里时,正是PC客户服务器技术初具雏形,随后经历了互联网、云计算和移动互联网的发展。而现在,我们处在一个新的技术转型的开始,即人工智能(AI)的新时代。

我认为始终有助于我自我定位的,是核心驱动力的理解。我还记得自己在1992年加入微软时,对于科技演变的隐含理解就是摩尔定律。 基本上,我只需关注这一点。实际上,我记得在1991年参加PDC时,我就意识到,“哇,接下来会发生的事情是,x86架构和PC架构不仅会在个人电脑上取胜,还将主导服务器市场。”这在90年代末期的确应验了。同样的事情正在发生,我们也可以在AI中看到一种新的规律,即扩展规律。

扩展规律是一种经验法则,就像摩尔定律一样,它并非物理法则,而是一种经验观察。但它却是事实,并且同样地,扩展规律表明我们每六个月的能力将会翻倍。 实际上,我常常思考的是性能,可以说是每花费一美元所获得的“令牌”(tokens)。这是新的“货币”。你可以通过每六个月的翻倍来衡量它,其中一部分源于计算能力,而很大一部分实际上来自于更好的数据利用和算法技术。因此,这种趋势从2010年代初期的深度神经网络时代开始,到了2018年、2019年,随着大规模语言模型(LLMs)和变换器的出现,开始加速发展。这一切以三种基本方式表现出来。

首先,我认为计算接口正发生根本性变化。一旦你拥有多模态的自然语言输入和输出,包括图像、语音、文本和视频,那么每一个计算接口都将改变。 其次,推理能力不断提升。如果我们看看最近发布的o1,它为我们提供了规划和推理能力。在过去的70年计算历史中,技术的核心一直是对人、事、物的数字化和理解。而现在,我们有了新的推理引擎来帮助理解这一切。 最后,我们可以提供更多的上下文和记忆。将这三者结合在一起,我们正在构建一个非常丰富的AI或智能代理世界,在这个世界中,你将拥有个人代理、团队代理和组织代理。这些丰富的AI代理将增强我们构建的一切数字基础设施和工具。

当然,所有这些技术的出现是非常好的,但问题是我们该如何利用这些技术?最重要的是,我们如何将其转化为我们作为公司、个人和组织的最重要使命,以赋予人们做以前任何技术时代都无法做到的事情的能力。

在我看来,这才是最终的考验:我们是否能够利用这些技术,像克莱尔所提到的那样,在这个国家的历史上,那些工业时代的开创性技术都是在这里诞生的。 问题是,我们现在是否能够回到这一点,真正对人类生活和状况产生深远影响?无论是科学发现,还是提高生产力,我们是否能够看到由于技术而带来的创新繁荣?这就是我们的目标,也是我们的使命,赋能每一个人和每一个组织在英国实现更大的成就,无论是小型企业提升生产力,还是大型跨国公司在全球竞争中变得更加具有竞争力,公共部门的效率提升,健康和教育成果改善。 这正是我们所追求的目标。

为了实现这一目标,我们正在构建三个平台。第一个是Copilot。 我们认为,Copilot是AI的用户界面(UI),这是我对其最简单的理解。接下来,我们有Copilot和AI堆栈,以便您能够构建自己的AI和AI代理以及Copilot。最后,我们还有一套新的设备,这些都是Copilot设备。

我想谈谈这三个平台,从Copilot开始。正如我所说,如果你从这个丰富的代理世界开始思考,最终这需要与我们接触,这就意味着你需要一个用户界面。就像PC或手机曾是数字技术的用户界面,应用程序在手机或PC上也是如此。这些Copilot是所有AI的用户界面。即便在一个有许多代理独立工作的世界中,它们仍然需要向我们提出例外请求、获得权限,而这将通过新的组织层来实现,尤其是在工作完成的方式上。

实际上,工作、工作成果和工作流程都将发生变化。一个很好的例子是,就在一个月前,我们推出了一款名为Pages的产品。就像在90年代初我们推出Excel或Word,这些编辑器是用于创建新成果,Pages则是首个用户体验,用于创建AI优先的成果。 我可以搜索网络或我的工作以检索信息,然后将其放入Pages中,这是一份我可以在组织内共享的文档,我可以与AI和人类合作。我使用的隐喻是,我与AI合作,和我的同事一起工作。 这就是新的工作流程。之前的工作流程是我独自思考,创建成果并在组织内共享和协作。但是现在,我不仅有了AI这一认知增强工具,能够帮助我工作,还可以与我的同事协作以完成任务。

这真正是Copilot时代的开始,它不仅仅是一个聊天界面,而是表明聊天只是获取信息的一种方式,但它确实引导着更复杂的工作流程和协作。然后,扩展Copilot与您构建的任何代理的能力。这并不是关于任何特定成果、编辑或我们所创建的工作流程,而是您可以使用任何代理扩展Copilot。

实际上,Copilot Studio是一个低代码、无代码的方式,让您能够构建代理。这些代理实际上是建立在丰富的数据源之上的,首先,事实上,对于大多数组织而言,最重要的数据库就是包含您所有办公信息的数据库。这个数据库包含了谁为谁工作,项目中有哪些同事,特定团队或项目相关的文件,以及这些文件与人、项目之间的关系。

所有这些数据,以及您拥有的所有电子邮件、Teams对话,都存在于一个被称为图谱的第一类数据库中,或者是现在通过M365中曝光的底层数据。将其与Dataverse结合,后者包含您收集的所有业务流程数据,或收集到Fabric中的数据,所有这些都可以为这些代理所用。实际上,一个很简单的例子是,如果您想构建一个现场服务代理,并希望将其接口连接到Copilot。您只需提供系统提示,告诉它“嘿,我希望你成为一个现场服务代理”,并指向一个包含一堆与现场服务相关文档的SharePoint网站,甚至将其他数据源添加到其中,比如Dynamics作为现场服务的记录系统。您得到的输出实际上是一个现场服务代理,您现在可以与其进行对话,就像您与其他常规Copilot对话一样。

这种简单性就像过去我们创建Excel电子表格一样。 创建一个Excel电子表格的预测并没有什么神秘之处,就像您现在可以使用低代码、无代码的工具如Copilot Studio创建AI代理,并将其放入Copilot中。您甚至可以将其视为新型应用程序的形式,任何人都可以创建。因此,您甚至不需要等别人为您创建这个应用程序。

这是我们正在构建的Copilot和Copilot加代理生态系统。 这对于我们的影响是巨大的。实际上,在微软,如果我看一看,比如销售和市场营销等职能,我们现在拥有的定量结果是,整体效率提升了两位数。 例如,客户服务帮助台、IT帮助台、HR帮助台。再次出现我们的员工参与度、员工满意度、客户服务代理满意度都在上升,而成本浪费却在下降。在法律、财务等领域也是如此。因此,我们现在在规模上有证据证明这些工具正在根本改变工作。我会说,提升价值和减少浪费。 过去,工业公司通过精益生产实现的目标,如今终于在认知工作的大规模场景中得以实现。而这一切也正在英国发生。

实际上,我有机会见到了已经在各个领域使用这些技术的客户,看到当地的Copilot实例真是太棒了。我有机会与克利福德·钱斯(Clifford Chance)法律事务所会面,他们正在进行非常成功的工作。他们解释了围绕并购交易的工作流程,使用Copilot和Copilot Studio等工具,您可以创建这些代理,从而简化整个过程。 我还与联合利华(Unilever)会面,我以前并没有意识到,对于像联合利华这样的一家组织,由于他们在全球范围内接触到超过30亿用户的多样化产品, 他们在市场营销上的投入是非常巨大的。他们所做的最大事情之一是创作创意简报,而创意简报的准确性对于他们的营销效果至关重要。

但关键是,创作创意简报所涉及的繁琐工作、效率和准确性方面的问题正是他们着手解决的领域,并创造了这个出色的工具,彻底改变了创意简报的准备和质量。 这些仅仅是我们客户已经在其组织内部部署这些AI代理和Copilot以推动高影响力生产力的两个例子。当然,今天我们最激动的事情是,我们正在与英国政府宣布这一消息,以确保技术的扩散不仅发生在私营部门,也在公共部门发生。

因为,归根结底,我认为我们将产生的最大影响之一将是在政府提供的服务中,无论是在健康、教育、能源,还是政府的任何其他部门,都将利用这项技术进行转型。而这一切都始于把这项技术放在所有公务员的手中,让他们能够在自己的工作中使用它。 因为,当我谈论减少繁琐工作、提高生产力时,这最终会影响到我们公民所获得的服务,而这正是我们能够产生影响的地方。因此,我们对这一宣布感到非常兴奋。实际上,谈到技能——在英国,关于AI的技能,这是LinkedIn的数据——我昨晚看到的数据非常令人振奋,我们现在看到, 自2019年以来,获得AI技能认证的人数单调增加,增长了88%。

这在某种程度上证明了克莱尔在开幕词中提到的关于这个经济体的结构优势。因为人力资本以及已经建立的其他基础设施,我认为可以推动英国在AI时代的发展。因此,这一切都让人感到非常激动。

当然,我们并不会就此止步。我们真正兴奋的是,Copilot Studio自主代理即将问世。 我非常高兴今天首次宣布,我们正在AI平台上迈出下一大步,宣布您可以创建自主代理。实际上,今天您将看到我们同时发布的工具,将帮助创建这些自主代理,但更重要的是,我们正在为Dynamics 365等产品构建的代理,这些代理最终可以在需要用户界面的情况下连接到Copilot,但也可以独立工作。

为了展示这一切,我想请我的同事贾雷德·斯帕塔罗上台。


贾雷德·斯帕塔罗演示代理在Copilot Studio中的应用

谢谢,萨提亚。我相信我们中的许多人都熟悉麦肯锡公司(McKinsey & Company),这是全球最成功的管理咨询公司之一。对于麦肯锡来说,客户体验至关重要,他们一直努力确保简化和改善每一个与客户的接触点。 因此,想象一下,当他们同意与我们合作,使用Copilot Studio创建一个自主代理以简化部分客户体验时,我们的兴奋之情。

让我们来看看。一切从一封来自潜在客户的电子邮件开始,如您在屏幕上看到的那样。以前,他们有专人处理这些电子邮件,分析它们并决定接下来该怎么办,应该将其分配给谁,谁在公司里具备相关专业知识。 但这正是自主代理发挥作用的地方。

现在,电子邮件一到,代理立即启动。您看到的是,它开始解析电子邮件,处理人类语言的模糊性,例如,找出该项目的相关性,检查历史记录,同时将其映射到行业标准术语,最后寻找合适的人选在公司内进行下一步。这一切信息掌握在手后,代理便开始撰写电子邮件,将所有信息总结给接收的合作伙伴。

您在屏幕上看到的正是这一点。接收到大量人类撰写的电子邮件后,代理处理、总结,并将其发送给公司内合适的合作伙伴,以进行下一步。

现在,值得暂停一下反思您所看到的。 这一过程发生得如此迅速,您可能会错过其本质。但本质上,这个代理接受了一套宽松的指令,类似于您给人类同事的指示,并且能够处理人类交流中的所有模糊性,找出客户的下一步接触点。

这简直是魔法!但这仅仅是魔法的一半,因为现在我们要看看如何轻松创建这样的代理。为此,我们将转到Copilot Studio。在这里,您可以看到,我们与麦肯锡共同编写了代理,但不是使用复杂的编程语言,而是使用自然语言。您以相同的方式告诉同事执行任务。 您还可以设置称为触发器的内容,以监控某个电子邮件地址,并在收到电子邮件时立即做出反应。实际上,您可以将其设置为在各种系统中查找事件。这个代理全天候工作,等待触发它的事件。

您可以像对待人类同事一样为它添加知识。在这里,我们看到一个Word文档、一个SharePoint网站和关于业务的数据库,但当然,您可以添加额外的知识源。这包括像SAP或ServiceNow这样的业务系统,甚至是数据库。

最后,为了完成这个代理的工作,您为其提供一系列操作。我们在流程中看到了这些操作。这些操作包括提取相关信息或总结人类所写的内容。所有这一切共同构成了代理的强大功能,因为它可以处理人类所带来的所有模糊性。

现在,我们看到的是一封电子邮件来自一个新的客户接触点。 但这里令人兴奋的是,这一切都是可以扩展的。我们怎么知道它是可扩展的呢?我们可以查看活动面板,看到它正在处理的长长的客户接触点列表。放大顶部,例如,我们可以看到它已经处理了超过1300个接触点,目前有33个正在进行中。如果我们想要更多的细节,可以进入分析选项卡。

这意味着这个代理始终在为公司工作,这对我们来说非常激动。现在,尽管这个代理很出色,但有时它确实需要一些人类的帮助。因此,我们将跳到第二个案例,看看它在这个过程中遇到了一些问题。

如您所见,它已经完成了之前看到的步骤,但在寻找合适的合作伙伴时遇到了困难。如果我们放大,我们可以看到原因。在这里,我们看到它选择了合适的合作伙伴,但这个合作伙伴已经离开了公司。它有一条指令,如果确实如此,它需要向人类经理上报,以便提供另一个人选。

现在,看看这是什么样子,我们将转到Copilot的界面,看看与人类经理的交互。 在右下角,您会看到Copilot中弹出通知。经理可以获得所有所需的信息,并提供正确的人选将电子邮件转发给。回到代理那里,我们可以看到它接受了该信息并完成所需操作。

我们对此感到兴奋,因为它所能带来的商业价值。麦肯锡在试用中显示,它可以将潜在客户响应时间减少90%,减少30%的行政开销。在这张列表中,我们设想的是一个协调层,一堆代理可以在这里帮助个人、团队和整个职能以简化和自动化他们的流程,无论他们处于哪个行业。

这些代理非常易于制作,任何人都可以做到。您可以在Copilot Studio中设计和设置这些Copilot,您与他们的互动也发生在Copilot中。我们对这项技术感到非常兴奋。为了让您更直观地了解其使用情况,我们先播放一段视频,看看我们的几个客户的示例。


所以希望这能给您提供一些关于Copilot如何演变为工作、工作流程和工作成果的组织层,以及Copilot Studio加代理如何成为这些代理在个人工作、组织工作和业务流程中协同工作的协调层的感觉。

现在我想转到下一个平台,即Copilot加代理堆栈或AI平台。最终,您希望能够让每个层级的技术堆栈都在Copilot、Copilot Studio和您刚刚看到的代理下方可用,以便每个软件开发人员能够构建自己想要的AI系统。

这首先要拥有最广泛、最全面的基础设施。当我们思考Azure时,我们将其视为世界计算机。我们在60多个地区构建这一基础设施,在英国,我们有英国西部和南部。 实际上,去年我们兴奋地宣布投资超过25亿美元进行扩张,而这将是持续进行的。我们将把最佳的基础设施带到英国,包括传统计算和AI计算,以便您拥有基础设施可用。

我们正在做很多工作,以确保这些基础设施能够优化AI工作负载。 从硅开始,无论是与NVIDIA的合作,实际上,我刚刚查看了即将推出的GP-200s——我指的是带有液体冷却系统的GPU。 实际上,我们借用了液体冷却的技术,因为我们为自己的硅做过相同的工作,而这项技术现在在不同的硅中都可用。我们与AMD合作,因此在硅层面上我们有非常出色的合作伙伴关系。

然后,您通过构建最佳优化,不论是针对训练还是推理,来实现构建您的Copilot的目标。因此,基础设施层面正在进行大量的工作。

对于任何开发AI应用程序的开发者来说,数据是另一个非常重要的考虑因素。 因为归根结底,无论是训练还是推理,进行检索增强生成,您真的需要对数据状态进行管理。为了做到这一点,您希望将所有数据都带到云端,并与AI进行交互。因此,无论AI计算在哪里,数据就会去到哪里。

我们所做的事情是,无论是您的Oracle数据库、Snowflake数据库,还是其他任何数据库,您都应该能够将其带入云端。在此基础上,我们正在自己构建一套一流的云原生基础设施,数据基础设施,涵盖从OLTP(联机事务处理),例如Cosmos DB、SQL,还是Postgres或Fabric,后者是为AI时代构建的一流分析数据库。

数据状态在一个地方,这里可能正在进行一些最出色的工作。 实际上,考虑到AI和数据的结合,没有哪一个AI应用程序是不具有状态的。因此,AI API是无状态的,但一旦它们遇到真正的应用程序和工作负载,它们就变得非常有状态。 实际上,ChatGPT是Cosmos DB等服务最大的客户之一,这说明了当您构建应用程序时,如Copilot或ChatGPT,您需要一个强大的数据状态。

此外,我们还在构建应用服务器。 如果您设置了基础设施、数据,接下来您需要一个应用服务器。实际上,我记得以前来这里谈论过dot net,斯科特稍后也会谈论AI。他是我们很多dot net工作的重要参与者。

而我们又回到了另一个新的应用服务器时代。实际上,这个我们为云原生应用构建的应用服务器,无论是容器、应用服务,所有的AKS和功能依然是必需的。 实际上,再次,当我回想起ChatGPT的底层架构时,您会发现,每个GPU的使用都与多少常规计算与AKS的配备比例有关。 因此,您首先需要应用服务器。

然后是新的AI应用服务器,实际上这个AI应用服务器从广泛的模型选择开始。我们对与OpenAI的合作感到非常激动,所有的创新,无论是o1、GPT4o还是所有最新的前沿模型,此外还有来自Llama、Mistral等开源提供者,以及其他封闭源提供者,如Cohere。

因此,您拥有广泛的模型选择,一旦您拥有了广泛的模型选择,AI应用服务的下一个步骤是进行监督微调(SFT)。因此,您可以在所有这些模型之上提供微调服务,以便将其构建到您的应用程序中。 您拥有检索增强生成的所有工具,因此像Azure Search可以帮助您使您的数据更扎实。除此之外,您甚至还有服务,确保您的应用程序有守护机制。

因此,我们对应用服务器的创新感到非常兴奋。 您拥有应用服务器,AI应用服务器,以及最佳工具链。我最自豪的事情之一是自1975年以来,微软在谈论我们为软件开发人员构建的工具时总是最兴奋的,这就是我们核心所在。 通过VS Code、GitHub和GitHub Copilot,软件开发人员可以用这些工具开辟全新的前沿。实际上,我最近看到的最酷的事情之一是,随着o1进入GPT4o或GitHub Copilot,您可以使用AI进行下一层的优化。

我想您在我身后看到的幻灯片中,我们用于GitHub Copilot的自动编码器正由o1进行优化。 因此,思考一下这种递归性,即我们使用AI来构建AI工具,以构建更好的AI。这是一种新前沿,实际上,GitHub下周或下下周将举办GitHub Universe。我迫不及待地想看到我们即将推出的GitHub Copilot工作空间。

实际上,在英国,我们现在有370万GitHub开发者,增长速度非常快,我想这是全球第五大。 我们的增长率为22%,这真是太棒了。我认为会有一个真正的转折点。因为进入门槛大幅降低,我总是开玩笑说,现在每个周末我都能重新开始编码,这实在太棒了,因为感谢GitHub Copilot,任何人都可以获取仓库、克隆它并开始工作,实际上在有限的时间内完成项目。这是非常激动人心的。

在此,我也想谈一谈我今天早上有机会见到的许多合作伙伴。例如,英国心脏基金会(British Heart Foundation)一直在使用机器学习和AI进行长期工作,这真是太棒了。 甚至像使用Azure语音服务来模拟这些紧急呼叫,我没有意识到这对帮助人们在紧急时刻感到舒适地拨打电话是多么重要。因此,这是一个在关键时刻赋能人们的绝佳例子。汇丰银行(HSBC)也经历了许多客户旅程的转变,但他们展示的其中一个旅程是,关系经理在信用审批时的整个过程通过他们构建的AI工具转型,实际上就是他们自己的AI代理,这些代理与他们的移动应用以及关系经理使用的应用程序交互。

我还与Mondra的开发者进行了交流,他们正在为每个零售商在英国及更广泛地区构建整个食品安全和供应链的数字双胞胎,以提高其可持续性。这款产品将产生的实际影响是令人振奋的。 而我一直以来都很期待的一家初创企业Wayve采用了一种以AI为主的方式来实现ADAS,实际上是如何从基础原则出发,思考自动化的新方式。因此,让我们播放一段视频,让您了解一下。


因此,看到这种传播速度真的很令人兴奋,它不再是关于“这将会到来”,而是您可以看到这些平台在这里已经被应用于一些非常复杂的应用程序和使用案例。接下来,我想转到最后一个平台——Copilot加PC设备。

我们在半年前推出了Copilot加PC设备。我们对此感到非常激动。 这标志着一个全新时代的来临,您可以在边缘设备上同时拥有CPU、GPU和NPU。因为如果您仔细想想,迄今为止,扩展规律在云计算中运作良好。 但我认为,未来这一AI领域将不仅仅由云端发生的事情来定义,还将由边缘发生的事情来定义。我们将会在某些模型架构上实现根本性突破,使这种混合的使用成为可能。

因此,这并不是在思考一种旧式的客户端和服务器,而是将其视为一个持续的分布式架构。这是我们的架构方法。我们并不认为Copilot PC是独立存在的。当然,您可以将其用于隐私保护,但更重要的是,您可以将其与您在云端所做的一切结合使用。

为此,让我们播放一段视频,展示这些设备的情况。


对于那些游戏爱好者而言,当您的GPU全力运行时,NPU可以为所有向量操作留出空间,这将是令人兴奋的。因此,这正是即将实现的应用程序开发的类型。这将是一个新的平台,就像人们为PC构建新应用程序一样。在GPU、NPU和CPU的世界中,您将看到人们开始开发应用程序,这将是一个非常有趣的世界。

我想最后谈一谈支撑这三个平台的内容,即可信赖的AI、可信赖的隐私和安全。因为对技术的信任最终将是我所提到的所有传播的核心。 因为如果您不信任它,就不会使用它,这对任何人都没有好处。因此,我们所做的事情非常简单。首先是拥有一套核心原则,无论是在安全、隐私还是AI安全方面,都要有一套具体的原则。

但比我们所做的承诺更重要的是,实际上是我们正在建立的能力,以推动我们所做的承诺。 实际上,即使在今天,当您考虑到——比如说安全性,您在部署一个新的AI模型时,您希望首先真正考虑的就是测试对抗性攻击。这不仅仅是寻找漏洞,而是比如像提示注入,这对这个模型的影响如何? 因此,能够模拟对抗性攻击,这是一个重要的考虑,或者是我们在隐私方面所做的机密计算。

同样,关于AI安全性,我们知道大型语言模型(LLMs)会出现幻觉。因此,当谈到AI安全性时,其中一项工作是利用AI来衡量任何输出的可靠性。 因此,这些都是我们在构建平台时实际进行的具体能力,以便软件开发人员能够拥有信任,而使用这些软件开发人员使用的产品的用户也能够信任他们使用的产品。

因此,这对我们来说是核心所在。所有这些都回到我一开始所说的,技术必须转化为现实世界的影响,一次一个人、一个组织在英国,以便我们能够推动经济的盈余和增长,真正改善经济中的结果。 我对我认为你们和你们的合作伙伴将会在未来几年内做出的所有创新感到无比兴奋。非常感谢大家,谢谢!

退出移动版