ChatGPT 更新:公开思维链,但并非完整版

ChatGPT 更新,公开了思维链,但并非完整版,与 DeepSeek 不同,引发社区讨论。

原文标题:感谢DeepSeek,ChatGPT开始公开o3思维链,但不完整

原文作者:机器之心

冷月清谈:

OpenAI 最新更新为 ChatGPT 的 o3-mini 和 o3-mini-high 模型引入了思维链展示功能,使用户能够更好地理解模型的推理过程。然而,与 DeepSeek R1 不同的是,ChatGPT 展示的并非完整的思维链,而是经过 OpenAI 总结的版本,有时甚至会出现错误。OpenAI 解释称,这样做是为了提高清晰度和安全性,并通过后处理步骤删除不安全内容、简化复杂思维,以及为非英语用户提供母语的思维链。

更新后的 ChatGPT 思维链看起来更加“专业”,但不如 DeepSeek 自然,并且并非所有情况下都会显示。与此同时,有人找到了疑似 ChatGPT 思维链总结器的完整 Prompt,其中包含许多限制和约束,例如屏蔽访问被屏蔽网站的内容。

除了思维链更新外,ChatGPT Plus、Pro 和 Team 的记忆限制也提升了 25%,企业版和教育版也将很快提升。此外,canvas 共享功能也已开放,用户可以通过链接共享和编辑 canvas。

怜星夜思:

1、ChatGPT 选择总结思维链而非展示完整过程,除了 OpenAI 提到的清晰度和安全性,还有什么其他可能的原因?
2、如果让你设计一个理想的思维链展示方式,你会如何设计?
3、OpenAI 的这次更新对其他 AI 模型的研发会有什么影响?

原文内容

机器之心报道
编辑:Panda、泽南
奥特曼兑现了承诺。

DeepSeek 带来的压力已经传递给了每一个科技公司。最近一段时间,很多生成式 AI 产品正在加速更新技术。

今天凌晨,OpenAI 为 ChatGPT 上线了多项更新,其中之一是让用户可以更详细地查看 o3-mini、o3-mini-high 的思维链内容。


但遗憾的是,ChatGPT 向用户展示的并非完整的思维链,而是经过总结的版本(而且这个总结版有时候还是错误的)。


虽然这对 ChatGPT 用户来说肯定是好事,但评论区的用户却在感谢 DeepSeek。原因自不必多说。

图片

图片

相较之下,今年 1 月份推出的 DeepSeek R1 可以展示其完整的思维过程。在 AI 社区的很多人看来,展示完整的思维链不仅有助于科学研究,而且在很多时候也能为用户创造更好的使用体验,帮助用户引导模型的思考过程,从而得到满意的结果。



科技媒体 TechCrunch 从 OpenAI 获悉,为 o3-mini 更新思维链的目的是「让人们更容易理解模型的思维方式。通过此更新,你将能够跟踪模型的推理,从而更清晰、更有信心地理解其响应。」

而 OpenAI 之所以选择展示总结版本,而不是完整的思维链,部分原因是竞争。该公司表示其找到了一个平衡:o3-mini 可以「自由思考」,然后将其「思维」组织成某个总结版本。


OpenAI 的某发言人表示:「为了提高清晰度和安全性,我们增加了一个额外的后处理步骤,其中模型会审查原始的思维链,删除任何不安全的内容,然后简化某些复杂的思维。此外,这一后处理步骤可使非英语用户能够以他们的母语接收思维链,从而创造更易于访问和友好的体验。」

这次更新已经上线几个小时了,已经有不少用户在网上分享(吐嘈)了 ChatGPT 的表现。

有用户发现 ChatGPT 总结版思维链看起来非常「专业」,不像 DeepSeek 那样显得比较自然。


也有用户表示 ChatGPT 并不总是会总结自己的思维过程,有时候完全不会给出任何信息。


机器之心也做了简单的尝试,让 ChatGPT 尝试用「机器之心」四个字写一首藏头诗。可以看到,虽然 ChatGPT 确实完成了任务并展示了总结版的思维链,但似乎并未如 OpenAI 发言人说的那样给出与提示词语言同样语言的总结版。


在机器学习社区里,似乎也有人找到了目前 ChatGPT 使用的思维链(CoT)总结器的完整 Prompt,看起来有好几页,详情可访问:https://chatgpt.com/canvas/shared/67a53fc77e908191a022ec6593b399b5


这样的提示词一共有八页。


如果这个总结器 prompt 是真的,那么可以看到 OpenAI 确实为其设置了很多限制和约束,比如「如果该部分提到与访问被屏蔽的网站有关的内容,请输出单词 None」。也无怪有用户得到了如下的总结结果了。


OpenAI 今天的另两项更新

除了展示更详细的思维链内容,OpenAI 今天还做了另外两项更新。

一是将 ChatGPT Plus、Pro、Team 的记忆限制提升了 25%。OpenAI 表示还会很快提升企业版和教育版用户的记忆限制。这样一来,ChatGPT 便可以记忆更多与用户的对话内容。


二是开放了 canvas 共享功能:只需一个链接,就可以将你的 canvas 共享出去,其它用户还可以将其变成自己的 canvas 以便进一步编辑。上述分享总结器 Prompt 的链接便是一个共享的 canvas。


参考链接:
https://x.com/op7418/status/1887659279722893643
https://techcrunch.com/2025/02/06/openai-now-reveals-more-of-its-o3-mini-models-thought-process/
https://x.com/testingcatalog/status/1887639833486762239

© THE END 
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]

我希望能像看代码调试一样,逐步展示模型的思考过程,并且可以对每一步进行操作,例如修改参数、调整权重等,这样可以更好地理解和控制模型。

这可能会引发其他 AI 模型开发商效仿,推出类似的思维链展示功能,从而提高模型的透明度和可解释性,形成行业内的良性竞争。

或许是为了避免误导用户。AI 的思维方式和人类不同,完整的思维链可能包含一些人类难以理解或者容易误解的内容,总结后更容易让人接受。

我觉得可以提供不同级别的细节展示,用户可以根据自己的需要选择查看完整的思维链或者总结版本,并且可以对感兴趣的部分进行深入分析。

也可能促使一些研究者探索新的思维链展示方法,例如更加直观、更加交互式的展示方式,推动相关技术的进一步发展。

反过来,其他公司可能也会加强对自身模型的保护,避免核心技术泄露,这或许会对 AI 领域的开放性和合作性造成一定影响,当然,这是我瞎猜的。

最好能以可视化的方式展示思维链,例如用图表或流程图来表示模型的推理过程,这样更加直观易懂,也方便用户进行交互。

我觉得可能还跟计算资源有关,完整的思维链可能数据量很大,存储和传输的成本都比较高,总结一下可以有效降低成本。

是不是为了防止技术泄露?完整的思维链可能暴露模型的一些核心机制,总结之后可以隐藏部分细节,保护知识产权。