OpenAI 高层 Reddit AMA 完整翻译
GPT-5 及即将推出的模型
- GPT-5:今年没有发布 GPT-5 的计划,尽管后续会有重要更新。
- 重点在于改进 o1 系列模型及其后续版本,而非推出 GPT-5。
GPT 与 o1 模型系列
- OpenAI 将继续开发 GPT 和 o1 模型系列。
- 预计两种系列会逐渐合并。
- 完整的 o1 模型将很快发布,其性能比当前的 o1-preview 更为显著。
更长的上下文窗口
- OpenAI 正在努力扩展 ChatGPT Plus 和 GPT-4o 的上下文窗口。
- 当前的 32k token 窗口被认为不足以应对较长的任务,尤其是代码和写作任务。
- 增加上下文窗口是 OpenAI 当前的重点之一。
图像模型与 GPT-4o 的“渲染”功能
- 新的文本生成图像模型正在开发中,但尚无具体发布时间。
- o1 系列模型将支持图像输入,并在未来几个月内提供多模态和工具使用等功能。
- GPT-4o 可以使用 HTML 提示直接从文本生成图像,并具有出色的图像到图像生成能力。
SearchGPT、出版商和分析功能
- OpenAI 对与出版商的合作持开放态度,希望将来可以显示引用来源。
- SearchGPT 比传统搜索引擎更高效,特别适合处理复杂查询。
- 设想未来搜索功能可以为用户查询生成动态、定制的网页。
AGI(人工通用智能)
- OpenAI 认为在当前硬件下可实现 AGI。
- AGI 的实现有望加速科学发现,特别是在健康和医学领域。
- 现有模型架构的突破可能有助于实现 AGI。
- OpenAI 正在探索用医学文献训练模型,以提升医学领域表现。
- 其企业产品正在努力达到 HIPAA 合规(医疗数据隐私保护标准)。
2025 年的代理功能和未来展望
- 预计到 2025 年,ChatGPT 将能够自主完成任务。
- 代理功能(agents)将成为 GPT 产品线的下一大突破。
- 预计到 2025 年,所有基准测试的水平将达到饱和状态。
高级语音模式(AVM)和新功能
- OpenAI 正在放松对音乐功能的限制,包括让 ChatGPT 可以“唱歌”。
- 开发中的功能还包括具有视觉功能的高级语音模式和摄像模式,但暂时没有具体发布时间。
- 模型在处理中断方面的能力已显著提升,这需要精心设计。
开源与可访问性
- OpenAI 认识到开源在 AI 生态系统中的重要性,未来有望开源更多内容。
- 目前,OpenAI 专注于提供强大且安全的 API 和服务,以满足安全需求。
NSFW 内容与用户控制
- OpenAI 支持为成人用户提供 NSFW 内容控制权,但正确实现这一功能具有挑战性。
- NSFW 控制并非当前优先事项,因为其他领域需求更为迫切。
- 当资源充足时,OpenAI 会在未来解决此问题。
推理成本与 API 定价
- 推理成本在过去一年内已降低约 10 倍。
- 像 GPT-4o-mini 这样的模型成本仅为最初 GPT-3 的约 2%。
- 预计未来推理成本将持续下降,包括语音等高级功能。
面向 AI 爱好者的建议与用例
- OpenAI 鼓励用户日常使用 AI 工具以提升生产力并产生创意。
- 适应和快速学习被认为是未来的关键技能。
- 用户利用 ChatGPT 总结医学报告和创建自定义 GPT(如课程笔记或旅行推荐)。
- 鼓励用户创建有趣的内容并与他人分享,为 AI 领域贡献力量。
- OpenAI 对帮助企业快速采用 AI 的合作伙伴关系持开放态度。
减少幻觉与模型改进
- OpenAI 专注于减少幻觉现象,但这被认为是一个挑战。
- 模型在引用可信来源方面有所改善,有助于减少错误信息。
- 使用强化学习奖励准确性,减少幻觉现象。
多语言改进
- OpenAI 正在改善 非英语语言的性能。
- GPT-4o 在处理多语言方面相较早期模型有显著进步。
- 提升多语言功能是 OpenAI 的优先事项。
ChatGPT 的早期反响
- OpenAI 对人们对 ChatGPT 早期版本的积极反响感到意外。
- 初期产品有许多限制,如准确性和功能缺乏,但仍受到大量用户喜爱。
- 尽管存在不足,用户仍然在原型中找到了价值。
欧盟法规
- OpenAI 将遵守欧盟政策,并希望监管变得越来越合理。
- 认可欧洲在全球的重要地位。
Jimmy Apples 和草莓表情
- Sam Altman 否认自己是 “Jimmy Apples”。
- 当被问及是否是“草莓男”时,Sam 以草莓表情回复。
完整问题与回答
- 关于人们使用ChatGPT进行治疗的看法?
- 回答:它显然不是一个治疗师,但显然很多人从与它谈论问题中获得了价值。我们看到很多初创公司在这里进行探索;我希望有人能建立一些伟大的东西!
- 计划继续发布o系列模型吗?
- 回答:两者都会!我预计它们会在某个时刻趋于一致。
- 你希望ChatGPT能做什么但现在还不能?
- 回答:我希望它能更好地理解我的个人信息并代表我采取行动。
- Seriously though — what did Ilya see?
- 回答:the transcendent future. ilya is an incredible visionary and sees the future more clearly than almost anyone else. his early ideas, excitement, and vision were critical to so much of what we have done, for example he was one of the key initial explorers and champions for some of the ideas that eventually became o1. the field is very lucky to have him.
未来的超越性发展。Ilya 是一位不可思议的远见者,比几乎任何人都能更清晰地洞察未来。他的早期构想、激情和愿景对我们的许多工作至关重要。比如,他是最早探索并支持某些理念的人之一,这些理念最终演变为 o1 项目。该领域有他是非常幸运的。
- 回答:the transcendent future. ilya is an incredible visionary and sees the future more clearly than almost anyone else. his early ideas, excitement, and vision were critical to so much of what we have done, for example he was one of the key initial explorers and champions for some of the ideas that eventually became o1. the field is very lucky to have him.
- Any special present for ChatGPT on its birthday?
- 回答:GPUs! GPU!
- What is the best use case of ChatGPT you have seen in the wild so far?
- 回答:
- 有很多很棒的案例,但听到人们找出致残疾病的原因并完全治愈的故事真的很棒。
- 还有很多,但成为一名优秀的软件工程师的能力仍然被低估。更一般地说,帮助科学家更快发现新知识的能力将是非常伟大的。
- 回答:
- Hello, I would like to ask when the token context field of GPT4o gets increased.
- 回答:同意。我们正在努力解决这个问题!
- Are there any plans to add integrations for publishers to verify and register accounts?
- 回答:这是个好主意!我们会讨论这个问题,但目前没有计划。
- When will you guys give us a new text to image model?
- 回答:下一个更新会值得等待,但我们还没有发布计划。
- Hello, OpenAI team, thank you for hosting this AMA. My question is about the value SearchGPT offers compared to popular search engines.
- 回答:对于许多查询,我发现它是一种更快/更简单的获取信息的方式。我期待未来搜索查询可以动态渲染自定义网页的响应!
- Will we see Advance Voice loosen restrictions around musical capabilities (like singing) at some point?
- 回答:我们正在努力!我也想听到ChatGPT唱歌。
- Will you be using ChatGPT to answer these questions?
- 回答:有时会。
- Release date of chatgpt-5 or its equivalent?
- 回答:我们有一些非常好的发布计划,但不会称其为gpt-5。
- Will ChatGPT eventually be able to perform tasks on its own?
- 回答:我认为这将在2025年成为一个重要主题。
- Do you guys have any plans to increase the memory ChatGPT can store?
- 回答:你是指更长的上下文窗口吗?如果是的话,是的。
- When will you release the camera mode for ChatGPT?
- 回答:我们正在努力,但还没有确切的日期。
- When will you increase the context window for the Plus version?
- 回答:我们正在努力!我对更长的上下文感到兴奋。
- Can we please get a hands-free way to end a voice conversation with ChatGPT?
- 回答:我喜欢这个主意。现在与团队分享!
- Why does o1 not support image input?
- 回答:我们专注于首先将其推出到世界,而不是等待使其功能齐全。图像输入将在o1中推出。
- Does ChatGPT have a mascot?
- 回答:无回复。
- Once AGI is achieved, what’s the first thing you would like to apply it on?
- 回答:我希望它能加速科学发现。我个人对健康/医学非常感兴趣。
- How fast does OpenAI see inference costs reducing?
- 回答:我们预计推理成本将继续下降。过去一年,下降了大约10倍。
- When will full o1 release?
- 回答:无回复。
- Is AGI achievable with known hardware?
- 回答:我们相信它可以在现有硬件上实现。
- Is the full o1 really a noticeable improvement from o1-preview?
- 回答:无回复。
- Is sora being delayed due to the amount of compute/time required for inference or due to safety?
- 回答:需要完善模型,确保安全性/防止冒充等问题,并需要扩展计算能力!
- Is ChatGPT search still using Bing as the search engine behind scenes?
- 回答:我们使用一系列服务,必应是一个重要部分。
- What’s the best personal assistant workflow you’ve seen?
- 回答:有两个我非常感兴趣的:
- 使用它来总结医疗报告并帮助你向医生提出正确的问题。
- 人们上传自己的知识以创建其他人可以使用的自定义GPT。
- 回答:有两个我非常感兴趣的:
- When will we get more information about GPT4o image and 3D models generation?
- 回答:很快!
- How will o1 influence Scaling LLM’s?
- 回答:这不是二者之一,而是两者——更好的基础模型加上更多的推理时间计算。
- OpenAI has shifted from a more open-source approach to a more closed model in recent years.
- 回答:我认为开源在生态系统中扮演着重要角色。我们也认为提供强大且易于使用的API和服务在世界上有重要作用。
- Any timeline on when we’ll get AVM vision?
- 回答:我们正在优先考虑发布o1及其后续版本。
- Question for Sam Altman: Are you the strawberry guy?
- 回答:无回复。
- Was there anything that surprised you when you released ChatGPT?
- 回答:最大的惊喜是人们对它的喜爱程度。
- Are hallucinations going to be a permanent feature?
- 回答:我们正在专注于减少幻觉,但这是一个根本上困难的问题。
- What’s the next breakthrough in GPT line of product and what’s the expected timeline?
- 回答:我们将有更好的模型,但我认为下一个巨大的突破将是代理。
- Long term goals regarding the ability for adult users to toggle “nsfw” content?
- 回答:我们完全相信以成人的方式对待成年用户,但这需要很多工作。
- How can the model improve in other languages than English?
- 回答:我们始终在提高其他语言的模型性能。
- Advice for ambitious youngsters that want to contribute to the revolution of AI?
- 回答:开始每天使用它。利用它来教你东西,学习你想学习的任何东西。
- How are you handling the pressure with so many top men leaving OpenAI?
- 回答:虽然我们对一些离开的人感到遗憾,但我们有一个非常有才华的团队和许多新加入的优秀人才。
- Are you planning to reduce the API cost of Advanced Voice?
- 回答:我们已经降低了API的成本,并预计将继续这样做。
- Regarding the future, what do you think will be the most important technology for the next decade?
- 回答:我认为AI将继续主导技术进步。
- What are your thoughts on the ethical implications of AI?
- 回答:我们需要非常小心地处理这些问题,确保技术的使用是负责任的。
原帖:https://www.reddit.com/r/ChatGPT/comments/1ggixzy/ama_with_openais_sam_altman_kevin_weil_srinivas/