bg
搜索
简
APP
主页 > 国际 > 欧美

OpenAI再推新模型 国际数学奥林匹克资格考答对率83%

文 文 文

(华盛顿13日综合电)OpenAI表示,该公司开发一系列新的AI模型OpenAI o1,即日起提供使用。这些模型能够通过复杂的任务并解决比以往更难的问题,包括科学、程式和数学领域。

OpenAI在ChatGPT和API中推出这个系列的第一个模型,该模型是预览版本,OpenAI期望会有定期的更新和改进。OpenAI表示,他们训练这些模型在回应之前花更多时间思考问题,类似于人类的思维过程。通过训练,它们学会了精炼自己的思考过程,尝试不同的策略并识别自己的错误。

在测试中,新登场的模型更新将在物理学、化学和生物学的任务中表现类似于博士生。我们还发现它在数学和编写程式方面表现优异。在国际数学奥林匹克(IMO)的资格考试中,GPT-4o仅正确解决了13%的问题,而新的推理模型则达到了83%。它的城市能力在比赛中被评估达到Codeforces竞赛的第89百分位。

工作人员解说如何使用OpenAI o1。

作为一个早期模型,OpenAI o1-preview尚未具备ChatGPT所拥有的许多有用功能,例如网页浏览和文件、图像上传。在许多常见情况下,GPT-4o在短期内会表现更优异。但对于复杂的推理任务,新模型展现全新高水准,表现出显著进步,因此OpenAI将这个系列命名为OpenAI o1。

OpenAI表示,为了匹配这些模型的新能力,该公司加强了安全工作、内部治理和联邦政府合作。这包括使用我们的准备框架进行严格的测试和评估,并由安全性委员会进行董事会级的审查过程。


OpenAI强调,该模型增强的推理能力对于处理科学、程式、数学等类似领域的复杂问题可能特别有用。例如,o1可以被医疗保健研究人员用来注释细胞测序数据,物理学家用来生成量子光学所需的复杂数学公式,以及各领域的开发人员用来构建和执行多步骤工作流程。

文: 综合报导
图: 截取自YouTube

高兴
高兴
惊讶
惊讶
愤怒
愤怒
悲伤
悲伤
关怀
关怀
mywheels