微软发布最强 AI 电脑:Copilot+ PC 能听、能看、能说 而且能记住你一切

5月20日,微软在其特别活动上,向世界介绍了一种新类别的Windows PC,一款专为AI设计的Copilot+ PC

Copilot+ PC引入了全新的系统架构,将 CPU、GPU 和高性能神经处理单元(NPU)结合在一起,并与 Azure 云中的大语言模型(LLM)和小语言模型(SLM)协同工作,带来前所未有的性能水平。

微软宣称Copilot+ PC是迄今为止最快、最智能的Windows PC。它拥有强大的新型芯片,能够达到惊人的每秒40万亿次操作(TOPS),具备全天电池续航以及访问最先进的AI模型的能力。通过Recall功能,用户可以轻松找到并记住PC中看到的内容;使用Cocreator功能,几乎可以实时在设备上生成和优化AI图像;通过实时字幕功能,可以将40多种语言的音频翻译成英文,从而跨越语言障碍。

新款Copilot+ PC,今天开始接受预订,并将于6月18日开始发货。Copilot+ PC的起售价为999美元,这些设备来自Microsoft Surface以及我们的OEM合作伙伴Acer、ASUS、Dell、HP、Lenovo和Samsung。

Copilot+ PC性能

通过引入了全新的系统架构,将CPU、GPU以及新的高性能神经处理单元(NPU)的力量结合在一起。与运行在Azure云端的大语言模型(LLM)和小语言模型(SLM)相连并增强,Copilot+ PC现在可以达到前所未有的性能水平。它们在运行AI工作负载时的性能提升高达20倍,效率提升高达100倍,提供行业领先的AI加速能力。

在持续多线程性能上比苹果的MacBook Air 15”快58%,同时提供全天电池续航。在极高的效率下,Copilot+ PC可以在一次充电中提供长达22小时的本地视频播放或15小时的网页浏览时间,这比MacBook Air 15”的本地视频播放时间多出20%。

新款 Surface 笔记本电脑和 MacBook air M3 进行了批量照片编辑对比。他们处理工作的速度几乎是后者的两倍

Copilot+ PC利用强大的处理器和多种最先进的AI模型,包括Microsoft的多款世界级SLM,解锁一系列可以本地运行的新体验。这消除了诸如延迟、成本甚至隐私方面的限制,帮助您提高生产力、创造力并更有效地沟通。

  1. 高性能处理器:Copilot+ PC 配备了先进的 Qualcomm Snapdragon X Elite 处理器,内置神经处理单元(NPU),能够每秒进行超过 40 万亿次操作(TOPS),提供卓越的 AI 加速能力。
  2. 电池续航具有超长电池续航能力,支持长达 22 小时的本地视频播放或 15 小时的网页浏览,满足全天候的使用需求。
  3. 应用程序性能近 90% 的应用程序时间都花在了原生 Arm 版本的应用程序上,这些应用程序提供了最高效的性能体验。此外,新的 Prism 仿真器大幅提升了仿真应用程序的兼容性和性能,使其比前一代 Windows Arm 设备快两倍以上。
  4. AI 加速性能NPU 性能比 MacBook Air 和 MacBook Pro 快 2 倍以上,为 AI 工作负载提供领先的加速能力,支持高效的本地 AI 应用运行,无需依赖云端处理。
  5. 多任务处理和效率Copilot+ PC 的硬件和软件设计优化了多任务处理能力,支持用户在多个应用程序和工作负载之间无缝切换,提高工作效率。
  6. 安全性能设备配备 Microsoft Pluton 安全处理器,确保开箱即用的最高级别的 Windows 安全性,保护用户的凭证、商业文件和 Recall 内容。

 

你现在可以在 PC 上启动 Copilot,它能够看到你电脑上正在进行的一切,当然,也能“了解和理解”你电脑中存储的所有信息。

比如,你正在玩《我的世界》,然后召唤 Copilot:

“嗨,Copilot,今天怎么样?”

“嗨,看起来你正在玩《我的世界》。”

“是的,我想知道怎么制作一把剑。”

接下来,Copilot 会用自然的语音一步步指导你操作,并通过桌面画面了解你已有的物品和原料库中的缺少物品。同时,它会给出具体的按键操作提示,帮助你顺利完成任务。

Windows Recall 即时回忆功能

借助其最新的NPU芯片,微软推出了一个叫做Windows Recall的功能,Windows Recall能够记录用户在PC上的所有操作,包括打开的文件、访问的网站、使用的应用程序等。

利用AI,用户可以通过语音或文本查询,轻松找到特定文件、电子邮件或网页。例如,可以询问“找到老板发的那封邮件“或“上周浏览过的那个网站”。

  1. 本地语义索引
    • Recall 通过在本地设备上创建一个个人语义索引来管理用户的所有活动。这个索引基于用户在设备上进行的操作和看到的内容进行构建,类似于建立一个个人化的数据库。
  2. 关系和关联的组织方式
    • Recall 通过分析用户在设备上的所有行为和内容,按照关系和关联的方式组织信息。这种方法模仿人类记忆的方式,帮助用户快速找到模糊记得的内容。
      .
  3. 时间线功能
    • Recall 提供了一个时间轴视图,用户可以通过时间线来回滚动,找到特定时间点的内容。这种时间轴不仅包含文件和网页,还包括应用程序中的特定操作。
      .
  4. 屏幕快照与对象识别
    • 每当用户在设备上执行操作时,Recall 就会自动生成屏幕快照类似于不断的给你的操作进行拍照记录,并使用对象识别技术识别快照中的关键内容和上下文。这些快照可以在用户需要时快速检索。
  5. 隐私与数据控制
    • 所有的数据和快照都存储在本地设备上,确保用户数据的隐私和安全。用户可以通过设置管理快照的保存范围和时间段,并随时删除不需要的快照数据。
  6. 智能搜索与提示
    • Recall 提供智能搜索功能,用户可以通过输入模糊的提示词来查找内容。系统会根据用户输入的提示,结合语义索引和快照数据,提供相关的搜索结果和操作建议。
  7. 跨应用程序整合
    • Recall 能够在多个应用程序之间整合信息,无论是电子邮件、文档还是网页内容,用户都可以通过Recall 快速访问并跳转到相关的应用程序和具体位置。
  8. 结合NPU(神经处理单元)的高效计算能力,Recall功能可以在本地高效运行,而无需频繁依赖云端计算,从而提高响应速度和用户体验。

Cocreator:在设备上实时生成和优化 AI 图像

Cocreator 是 Copilot+ 个人电脑的一项创新功能,旨在利用先进的 AI 技术提升用户的创意和生产力。

Cocreator 使用户能够在设备上实时生成和编辑 AI 图像,通过自然语言描述快速创建和优化图像。这项功能利用本地神经处理单元(NPU)和小语言模型(SLM),无需依赖云端处理,显著减少了延迟并增强了隐私保护。

主要特点

  1. 实时图像生成和编辑用户可以通过简单的文本描述生成图像。Cocreator 使用扩散算法优化生成过程,确保高质量输出,并允许用户在几乎实时的基础上进行迭代和修改。
  2. 自然语言输入用户可以使用自然语言描述他们想要创建的图像,例如“生成一个日落的风景”或“创建一张科技感的城市夜景”,Cocreator 会根据描述生成相应的图像。
  3. 创造力滑块Cocreator 提供了一个创造力滑块,用户可以调整生成图像的风格,从更具象到更具表现力的范围。用户可以选择和微调他们的艺术作品,以更好地表达他们的创意。
  4. 无缝集成的编辑工具生成图像后,用户可以继续对图像进行编辑和迭代。Cocreator 集成了强大的图像编辑工具,使用户能够对图像的细节进行进一步的修改和优化。
  5. 本地处理和隐私保护Cocreator 的所有图像生成和处理都在本地设备上进行,利用 NPU 和 SLM,确保数据不需要上传到云端,增强了隐私保护。
  6. 预设风格和个性化用户可以使用预设风格(如赛博朋克、黏土动画等)来重新想象他们的照片,改变背景、前景或整个图像,生成全新的视觉效果。

实际应用场景

Live Captions:支持40 多种语言实时翻译

Live Captions 能够将用户在设备上播放的任何音频实时转换为字幕,并支持多语言翻译。这项功能利用本地神经处理单元(NPU)和先进的 AI 模型,提供高效、精准的字幕和翻译服务,增强用户在不同语言环境下的沟通能力。

主要特点

  1. 实时字幕生成Live Captions 能够即时将视频通话、录音和流媒体内容中的音频转换为字幕。无论是在观看视频还是参加在线会议,用户都可以实时看到字幕,提高理解和参与度。
  2. 多语言翻译Live Captions 支持将 40 多种语言的音频实时翻译成英语字幕。用户可以在不同语言环境下无缝沟通,无需担心语言障碍。
  3. 离线操作Live Captions 的字幕生成和翻译功能可以在本地设备上运行,无需依赖互联网连接。这意味着即使在离线状态下,用户也能享受高质量的字幕和翻译服务。
  4. 隐私保护所有的字幕生成和翻译过程都在本地设备上完成,确保用户的音频数据不会上传到云端,从而增强了隐私保护。
  5. 跨应用支持Live Captions 可以在所有应用程序中一致地显示字幕,无论用户使用的是视频播放器、浏览器还是视频会议软件,都能享受到同样的字幕服务。
  6. 可定制化用户可以根据自己的需求自定义字幕的显示样式,包括字体大小、颜色和位置,以便更好地适应个人观看习惯。
  7. 便捷的操作界面Live Captions 功能集成在 Windows 操作系统的快速设置中,用户可以轻松启用或禁用该功能,并进行相关设置。

其他新的 AI 体验

包括:

Copilot+ 个人电脑还将支持多种商业应用,提升生产力、改善协作并提高效率。

Adobe

与Adobe一起,Adobe的旗舰应用将登陆Copilot+ PC,包括Photoshop、Lightroom和Express——今天即可使用。Illustrator、Premiere Pro等将于今年夏天推出。我们还将继续合作优化这些应用中的AI,使其在NPU上运行。

对于Adobe Creative Cloud用户,将受益于Copilot+ PC的全部性能优势,以前所未有的速度表达他们的创造力。

DaVinci Resolve Studio

使用NPU加速的Magic Mask在DaVinci Resolve Studio中轻松对对象和人物应用视觉效果。

CapCut

使用NPU中的自动剪切功能,高效快速的一键移除任何视频剪辑的背景。

Cephable

通过新的NPU支持的摄像头管道,使用头部移动或面部表情等更快、更响应的自适应输入控制保持工作流。

LiquidText

通过完全在设备上运行的AI功能更快、更智能地注释文档,使数据在LiquidText中保持私密。

djay Pro

通过在Algoriddim的djay Pro中独家支持NPU的NeuralMix™功能,享受分解和重新混音任何音乐曲目的乐趣。

全新和增强的Windows Studio效果

通过快速设置中触手可及的控制,自动展示最佳的形象和声音。人像光自动调整图像,以改善在黑暗环境中的照明或在低光环境中亮化前景像素。三种新的创意滤镜(插图、动画或水彩)增添了艺术色彩。眼神交流提词器帮助您在阅读屏幕时保持眼神交流。语音焦点和人像模糊的新改进确保您始终在焦点中。

Copilot将引入GPT-4o

每台Copilot+ PC都配备了您个人强大的AI智能体,只需在键盘上轻按新的Copilot键即可访问。

Copilot现在将拥有客户一直在寻找的完整应用体验,设计简洁但功能强大且个性化。Copilot将最先进的AI模型置于您的指尖。在接下来的几周内,您将可以访问最新的模型,包括我们的合作伙伴OpenAI的GPT-4o,这样您就可以进行更自然的语音对话。

 

以上内容来自微软官网、博客等渠道,部分视频来自:X @richontech 

退出移动版