首页 科技快讯 Sam Altman :这是我最后一篇没有AI帮助的文章了

Sam Altman :这是我最后一篇没有AI帮助的文章了

来源:晰数塔互联网快讯 时间:2025年06月11日 21:28

 

6月10日晚,Sam Altman 首先在X上宣布了o3模型降价80%,并暗戳戳预告了o3-pro版本的性价比。模型发布的同时,他写下了题为《温和的奇点》的文章。并表示,这可能是他最后一篇完全没有AI帮助的文章了。

 

 

6个小时之后,OpenAI 正式宣告了o3-pro 版本的登场。

 

 

o3-pro 是OpenAI 目前最智能的模型 o3 的一个版本,使用与 o3 相同的底层模型。与 o3 一样,o3-pro 可以使用 ChatGPT 所需的工具——它可以搜索网页、分析文件、推理视觉输入、使用 Python、利用记忆个性化响应等等。在此基础上,o3-pro提供了更可靠的响应。

 

也因此,它的响应通常需要更长的时间才能完成。官方建议将其用于棘手问题,主打可靠性,而不是速度。

 

即日起,o3-pro 将在 Pro 和 Team 用户的型号选择器中可用,取代 o1-pro。企业和教育用户将于下周获得访问权限。

 

据模型发布说明,OpenAI 通过专家评估、学术评估、“4/4 可靠性”评估三个指标来衡量o3-pro 版本的表现。

 

在专家评估中,评论者在所有测试类别中始终更青睐 o3-pro,尤其是在科学、教育、编程、商业和写作帮助等关键领域。评论者还一致认为 o3-pro 在清晰度、全面性、指令遵循性和准确性方面均获得更高的评价。

 

 

学术评估则表明,o3-pro 的表现始终优于 o1-pro 和 o3。

 

“4/4 可靠性”评估的考核标准是:当只有在四次尝试中(而不是一次)正确回答问题,模型才被视为成功。

 

在这个维度,OpenAI 的表现也可圈可点。

 

 

美国经济学家Tyler Cowen很快发文表示:“o3-pro非常非常好”。Sam Altman 也很较真,随即回复到:有多好?

 

并给大家举了个例子,转发了o3-pro “使用经验贴”。

 

具体来说,前 Apple 人机界面设计、现 Raindrop AI首席技术官Ben Hylak提前体验了 o3-pro。

 

起初,他觉得 o1/o1-pro 并不好用。后来他发现自己用错了它。而使用的关键在于:不要和它聊天,而是要把它当成一个报告生成器。

 

赋予它背景,设定目标,然后尽情发挥。

 

具体的操作上,他和他的联合创始人 Alexis 花时间整理了过去在Raindrop的所有规划会议记录,记录了所有的目标,甚至还录制了语音备忘录:然后请 o3-pro 制定计划。

 

结果让Ben和Alexis很震撼, 因为o3-pro 给出了他一直希望法学硕士能够创建的那种具体的计划和分析——包括目标指标、时间表、优先事项以及绝对要削减的内容的严格指示。

 

“o3 给我们的计划是可行的、合理的;但 o3-pro 给我们的计划是具体的、足够根深蒂固的,它实际上改变了我们对未来的看法。” Ben表示。

 

也就是说,如今的模型在独立测试中表现非常出色,以至于简单的测试已经用完了。而真正的挑战也随即到来:如何让它们融入社会,融入具体的现实情境?

“一个智商很高的12岁孩子去上大学。他们可能很聪明,但如果无法融入社会,就无法成为有用的员工。”Ben说到。

 

目前,大模型的集成主要体现在工具调用上:模型与人类、外部数据和其他人工智能的协作效果如何。它是一位优秀的思考者,但还需要进一步发展成为一位优秀的行动者。

 

Ben认为,o3-pro 在这方面取得了显著的进步:它能够更有效地识别自身环境;能够准确地传达其可以使用的工具;能够何时询问外部世界(而不是假装拥有相关信息/访问权限);能够选择合适的工具来完成工作。

 

他在帖子中还附上了自己的使用对比:o3-pro(左)与 o3(右)。

可以看到,o3-pro(左)能够更清楚地了解其环境的限制。

 

不过,o3-pro的缺点也很明显。例如,o3-pro 不支持图像生成,也不支持 Canvas。用户目前仍然需要使用 GPT-4o、OpenAI o3 或 OpenAI o4-mini 来生成图像。

 

在抢先版使用体验中,Ben也注意到:如果你不给它足够的背景信息,它确实容易想得太多。它非常擅长分析,擅长使用工具做事,但不太擅长直接做事。有些 ClickHouse SQL 问题 o3 显然做得更好,因人而异,也因任务而异。

 

未来,OpenAI 将花费更多时间在open-weights model上,预计它会在今年夏天晚些时候推出。

 

“我们的研究团队做了一些意想不到的、非常了不起的事情,我们认为它非常值得等待,但需要更长的时间。”Sam Altman 在X中说到。

 

Sam Altman似乎对o3-pro有着很深的寄托。“我为自己能用老套的方式写出‘从相对论的角度来看,奇点是一点一点产生的,融合是缓慢发生的’而感到自豪。”Sam Altman写到。

 

以下是《温和的奇点》全文:

 

我们已经越过了事件视界;腾飞已经开始。人类即将打造数字超级智能,而且至少到目前为止,它远没有看起来那么奇怪。

 

机器人还没有在街上行走,我们大多数人也还没有整天和人工智能对话。人们仍然会死于疾病,我们仍然无法轻易进入太空,宇宙中还有很多我们未解之谜。

 

然而,我们最近构建的系统在很多方面都比人类更聪明,能够显著提升使用者的产出。这项工作中最不可能的部分已经过去;成就 GPT-4 和 o3 等系统的科学洞见来之不易,但将引领我们走得更远。

 

人工智能将在诸多方面为世界作出贡献,但人工智能推动科学进步和生产力提升,对生活质量的提升将是巨大的;未来将远比现在更加美好。科学进步是推动整体进步的最大动力;想想我们还能取得怎样的进步,就令人兴奋不已。

 

从某种意义上来说,ChatGPT 已经比任何人类都强大。数亿人每天都依赖它,并完成日益重要的任务;一个小小的新功能就能带来巨大的积极影响;一个小小的偏差乘以数亿人,就能造成巨大的负面影响。

 

2025 年,我们会看到能够进行真正认知工作的代理的出现;编写计算机代码将不再是以前的样子。2026 年,我们可能会看到能够得出新颖见解的系统的出现。2027 年,我们可能会看到能够在现实世界中执行任务的机器人的出现。

 

将会有更多的人能够创造软件和艺术。但世界对软件和艺术的需求远超于此,只要专家能够接受新工具,他们可能仍然比新手更优秀。总的来说,到2030年,一个人能够完成的工作量将远超2020年,这将是一个显著的变化,许多人将会找到从中受益的方法。

 

从最重要的方面来看,2030年代或许不会有太大的不同。人们仍然会爱家人,发挥创造力,玩游戏,在湖里游泳。

 

但在一些仍然非常重要的方面,2030年代很可能与以往任何时期都截然不同。我们尚不清楚人类智能究竟能超越到何种程度,但我们即将找到答案。

 

2030年代,智力和能源——创意以及将创意付诸实践的能力——将变得异常丰富。长期以来,这两者一直是人类进步的根本制约因素;有了丰富的智力和能源(以及良好的治理),理论上我们什么都可以拥有。

 

我们已经生活在令人难以置信的数字智能之中,在最初的震惊之后,大多数人都已经习以为常。很快,我们就会从惊叹人工智能能够写出优美的文字,转变为好奇它何时也能写出一部优美的小说;或者,从惊叹它能够做出救命的医疗诊断,转变为好奇它何时能够研发出治愈方法;或者,从惊叹它能够编写一个小型计算机程序,转变为好奇它何时能够创建一家全新的公司。奇点就是这样:奇迹变成日常,然后成为起点。

 

我们已经听到科学家说,他们的生产力比人工智能出现之前提高了两到三倍。高级人工智能之所以引人注目,原因有很多,但或许没有什么比我们能够利用它更快地开展人工智能研究更重要。我们或许能够发现新的计算基础、更好的算法,以及其他未知的成果。如果我们能在一年或一个月内完成十年的研究成果,那么进步的速度显然会截然不同。

 

从现在开始,我们已经构建的工具将帮助我们获得进一步的科学洞见,并帮助我们创建更好的人工智能系统。当然,这与完全自主更新自身代码的人工智能系统不同,但无论如何,这都是递归式自我改进的雏形。

 

还有其他自我强化的循环在起作用。经济价值的创造已经启动了一个飞轮,不断增加基础设施的建设,以运行这些日益强大的人工智能系统。而能够构建其他机器人的机器人(从某种意义上说,能够构建其他数据中心的数据中心)的实现也并非遥不可及。 

 

如果我们必须以老式的方式制造出第一批一百万个人形机器人,但随后它们可以操作整个供应链——挖掘和提炼矿物、驾驶卡车、运营工厂等——来建造更多的机器人,从而可以建造更多的芯片制造设施、数据中心等,那么进步的速度显然会大不相同。

 

随着数据中心生产自动化,智能成本最终应该会趋近于电力成本。(人们常常好奇 ChatGPT 查询耗电多少;平均每次查询耗电约 0.34 瓦时,相当于烤箱一秒多一点的耗电量,或高效灯泡几分钟的耗电量。此外,它还会消耗约 0.000085 加仑水;大约相当于十五分之一茶匙的水。)

 

技术进步的速度将持续加快,人们几乎能够适应任何事物,这一点将持续下去。虽然会有一些非常艰难的部分,比如整个行业的工作岗位将消失,但另一方面,世界将以如此快的速度变得更加富裕,以至于我们能够认真考虑过去从未考虑过的新政策理念。我们或许不会一下子就采纳一项新的社会契约,但几十年后回首往事,这些渐进式的变革将产生巨大的影响。

 

如果历史可以借鉴,我们会发现新事物、新需求,并迅速掌握新工具(工业革命后的工作变动就是一个典型的例子)。期望会上升,但能力也会同样快速提升,我们都会拥有更好的产品。我们将为彼此创造更加美好的事物。人类比人工智能拥有一个长期重要且令人好奇的优势:我们天生就关心他人以及他们的想法和行为,而我们不太关心机器。

一千年前,一位自给自足的农民会看着我们许多人所做的工作,说我们所做的工作是虚假的,认为我们只是在玩游戏自娱自乐,因为我们有充足的食物和难以想象的奢侈品。我希望一千年后,我们看待这些工作时,会认为它们非常虚假,而且我毫不怀疑,从事这些工作的人会感到无比重要和满足。

 

新的奇迹将以惊人的速度不断涌现。今天甚至很难想象到2035年我们会有怎样的发现;或许我们今年解决了高能物理难题,明年就开始了太空殖民;又或许我们今年在材料科学上取得重大突破,明年就实现了真正的高带宽脑机接口。许多人会选择以类似的方式生活,但至少有些人可能会选择“融入生活”。

 

展望未来,这听起来难以理解。但经历这一切或许会让人印象深刻,但并非不可避免。从相对论的角度来看,奇点是一点一点出现的,融合也是缓慢发生的。我们正在攀登技术进步的长弧;它总是向前看是垂直的,向后看是平坦的,但它是一条平滑的曲线。(回想一下2020年,如果2025年能实现接近通用人工智能,那听起来会是什么样,而过去五年的实际情况又如何呢?)

 

在巨大的机遇和挑战面前,我们也面临着严峻的挑战。我们确实需要从技术和社会层面解决安全问题,但考虑到其经济影响,广泛普及超级智能的使用权也至关重要。最佳的前进方向或许是这样的:

 

解决对齐问题,这意味着我们可以强有力地保证人工智能系统能够学习并采取行动,实现我们长期真正想要的目标(社交媒体信息流就是错位人工智能的一个例子;支持这些算法的算法非常善于让你继续滚动并清楚地了解你的短期偏好,但它们是通过利用你大脑中某种超越你长期偏好的东西来做到这一点的)。

然后,专注于让超级智能变得廉价、广泛可用,并且不会过于集中于任何个人、公司或国家。社会具有韧性、创造力,并且适应能力强。如果我们能够驾驭人们的集体意志和智慧,那么尽管我们会犯很多错误,有些事情会变得非常糟糕,但我们能够快速学习和适应,并能够利用这项技术获得最大的好处和最小的坏处。在社会必须决定的宽泛范围内赋予用户很大的自由度,这似乎非常重要。世界越早开始讨论这些宽泛的界限是什么,以及我们如何定义集体共识,就越好。

 

我们(整个行业,不仅仅是OpenAI)正在为世界构建一个大脑。它将极其个性化,人人皆可轻松使用;我们将受到好想法的限制。长期以来,初创企业的技术人员一直嘲笑“创意人”;那些有想法却想找团队来实现它的人。现在在我看来,他们即将迎来辉煌的一天。

 

OpenAI 现在有很多事情要做,但首先,我们是一家超级智能研究公司。我们面前有很多工作要做,但前方的道路大部分已经照亮,黑暗区域正在迅速消退。我们非常感激能够从事我们所做的事情。

 

廉价到无法计量的情报唾手可得。这听起来或许有些不可思议,但如果我们在2020年告诉你我们将会达到今天的水平,那可能比我们现在对2030年的预测更疯狂。

 

希望我们能够通过超级智能平稳、指数级、平静地扩展。

文章标题:Sam Altman :这是我最后一篇没有AI帮助的文章了

文章链接:https://www.huxiu.com/article/4452651.html

阅读原文:Sam Altman :这是我最后一篇没有AI帮助的文章了_虎嗅网

相关推荐

Sam Altman :这是我最后一篇没有AI帮助的文章了
投资人烦死 Sam Altman 了
没有反转,Sam Altman 确定不会回归 OpenAI
OpenAI神秘“Q*项目”曝光:Sam Altman被开除的根源?
硅谷新王Sam Altman,站在聚光灯下
捉内鬼、“三杀”谷歌,Sam Altman:成功的为何是我?
专访Sam Altman:GPT-4o很棒,下一代可能不叫GPT-5
天才还是伪君子?为何大家开始讨厌Sam Altman了
被删除的Sam Altman谈话纪要,讲了什么?
ChatGPT的这个更新,竟然Sam Altman兴奋到睡不着觉?

网址: Sam Altman :这是我最后一篇没有AI帮助的文章了 http://www.xishuta.com/newsview137254.html

所属分类:行业热点

推荐科技快讯