OpenAI 发布 GPT-4o全能模型 实时语音和视觉能力 再次刷新业界

OpenAI 刚刚发布了 GPT-4o,这是一种新的人工智能模式,集合了文本、图片、视频、语音的全能模型。 能实时响应用户的需求,并通过语音来实时回答你,你可以随时打断它。 还具有视觉能力,能识别物体并根据视觉做出快速的响应和回答,具有非常强的逻辑推理能力。 它的速度比 GPT4-turbo 快 2 倍,价格便宜 50%!

根据传统的基准测试,GPT-4o 在文本、推理和编码智能方面的性能达到了 GPT-4 Turbo 的水平,同时在多语言、音频和视觉功能方面也创下了新高。

主要特点与功能

综合交互能力

性能提升与成本效率

语音模式的进步

测试与迭代

部署与可用性

其他一些更新

OpenAI将为 macOS 推出新的 ChatGPT 桌面应用程序,该应用程序旨在无缝集成到您正在电脑上进行的任何操作中。只需一个简单的键盘快捷键(Option + Space),您就可以立即向 ChatGPT 提问。您还可以直接在应用程序中截图并进行讨论。还可以直接从电脑与 ChatGPT 进行语音和视频对话。

同时ChatGPT 的用户界面进行了改版,使其更友好、更会话。您将看到全新的主屏幕、消息布局等。

另外GPT-4o 就是之前在在 LMSys 竞技场上测试了一个版本 即 im-also-a-good-gpt2-chatbot

下面是测试结果 牛P啊,遥遥领先…

Sam Altman对GPT-4o的评价

在Sam Altman的博客文章“GPT-4o”中,他强调了两个主要的更新和观点:

  1. 使强大的AI工具免费或低成本提供给用户
    • OpenAI的使命之一是向用户提供强大而高效的AI工具,且基本免费,如ChatGPT,并且没有广告等干扰。
    • OpenAI最初的设想是创造AI,并利用它为世界带来种种益处。现在的情形更多的是,OpenAI创造AI后,其他人将使用这些AI创造出让所有人受益的惊人成果。
    • 尽管OpenAI是一家商业机构,会发现许多收费的产品和服务,但其目标是向全球数十亿用户提供免费的、卓越的AI服务。
  2. 新的语音(及视频)模式是前所未有的计算机界面体验
    • 新的语音和视频模式被描述为最好的计算机界面,给人一种如同电影中AI的感觉,这种体验是真实而令人惊讶的。
    • 达到接近人类水平的响应速度和表达能力,带来了重大的改变。与计算机的交互从未感觉如此自然。
    • 新系统的快速、智能、有趣、自然和有用的特性,让与计算机的对话变得前所未有的自然。
    • 通过添加个性化选项、访问用户信息、代表用户采取行动等功能,Sam Altman展望了一个充满激动人心的未来,我们能够使用计算机做更多以前无法想象的事情。

最后,Sam Altman特别感谢团队为实现这些成就所投入的巨大努力。

更详细的功能介绍和展示:https://openai.com/index/hello-gpt-4o/

退出移动版