云开体育该公司将其定名为“o3”而不是“o2”-开云·kaiyun体育(中国)官方网站登录入口

发布日期：2026-02-06 12:24 点击次数：102

　　周五，在“OpenAI 12天当作”的第12天，OpenAI首席实施官萨姆·奥特曼告示了其最新的东谈主工智能“推理”模子o3和o3-mini，这两款模子是在本年早些时候推出的o1模子的基础上开辟的。该公司尚未发布这些模子云开体育，但今天将使这些模子可用于人人安全测试和探究。

　　这些模子使用OpenAI所称的“私东谈主想维链”，模子会暂停查验其里靠近话，并在反应之前提前盘算，你不错称之为“模拟推理”（SR），即一种超过基本大型谈话模子（llm）的东谈主工智能体式。

　　为了幸免与英国电信运营商o2发生潜在的商标突破，该公司将其定名为“o3”而不是“o2”。在周五的直播中，奥特曼承认了他的公司定名的症结，他说：“按照OpenAI相配相配不擅长寿名的伟大传统，它将被定名为o3。”

　　证据OpenAI的说法，o3模子在ARC-AGI基准上获取了破记录的分数，ARC-AGI基准是一种视觉推理基准，自2019年创建以来一直保抓不败。在低计议场景中，o3得分为75.7%，而在高计议测试中，它达到了87.5%，与东谈主类在85%阈值下的证明十分。

　　OpenAI还论说说，o3在2024年好意思国数学邀请赛中得分为96.7%，只缺了扫数题。该模子在包含探究生水平的生物、物理和化常识题的GPQA Diamond上也达到了87.7%。在EpochAI的前沿数学基准上，o3处分了25.2%的问题，而其他模子皆莫得跨越2%。

　　相似在周五发布的o3-mini版块包括自相宜想考本事功能，提供低、中、高处理速率。该公司暗意，更高的计议建筑不错产生更好的恶果。OpenAI论说说，在Codeforces基准测试中，o3-mini的性能跨越了它的前身o1。

　　模拟推理正在兴起

　　在OpenAI告示这一音信之际，其他公司也在开辟我方的SR模子，包括谷歌，谷歌周四告示了Gemini 2.0 Flash Thinking Experimental。旧年11月，DeepSeek推出了DeepSeek- r1，而阿里巴巴的Qwen团队则发布了QwQ，他们称QwQ是01的第一个“绽放”替代品。

　　OpenAI将最初向安全探究东谈主员提供新的SR模子进行测试。奥特曼说，公司盘算在1月底推出o3-mini，随后不久推出o3。

海量资讯、精确解读，尽在新浪财经APP

职守剪辑：李桐云开体育

上一篇：开云体育　　两年期好意思国国债收益率跌1.7个基点-开云·kaiyun体育(中国)官方网站登录入口
下一篇：云开体育换手率分歧为1.25%、1.07%、1.01%-开云·kaiyun体育(中国)官方网站登录入口

云开体育该公司将其定名为“o3”而不是“o2”-开云·kaiyun体育(中国)官方网站 登录入口

云开体育该公司将其定名为“o3”而不是“o2”-开云·kaiyun体育(中国)官方网站登录入口