OpenAI 推出了基于新人工智能技术 OpenAI o1 的新版 ChatGPT。 新版本有哪些新功能,如何更好地为科学家服务?

9月12日,OpenAI发布了基于OpenAI全新o1人工智能技术的新版ChatGPT虚拟助手。 自 2022 年推出第一版 ChatGPT 以来,该聊天机器人一直在不断改进,为用户提供新的功能。 在本文中,我们将看看最新的更新,了解新版本与之前版本的区别和更好之处。
新版 ChatGPT 的演示和功能
OpenAI 宣布,基于 OpenAI o1 技术的聊天机器人能够通过解决数学、编码和科学相关问题进行 "推理"。
在为《纽约时报》所做的演示中,聊天机器人被提出了一些谜题和化学问题,它的回答达到了博士水平,并根据病人的症状和病史的详细报告诊断出了一种疾病。
该公司还指出,这项新技术可以帮助物理学家生成复杂的数学公式,并协助健康研究人员进行实验。
专家们通过模仿人类的方法,教会这些模型在提供答案之前花更多时间分析问题。 通过这一学习过程,模型可以改进自己的思维,尝试不同的策略,并能认识到自己的错误。
改进人工智能的必要性
ChatGPT 通过分析互联网上各种来源的大量文本(尤其是维基百科文章、书籍和聊天室)进行学习。 通过分析文本中的模式,它获得了自行生成新文本的能力。 然而,由于互联网上虚假信息泛滥,该模型可以重现这些不准确的信息,有时甚至可以编造这些信息。
开发人员利用强化学习创建了新的 OpenAI 系统,这样系统就能通过多次试验和错误来学习,这可能需要几周到几个月的时间。 例如,在解决数学问题时,系统会发现哪些方法能得到正确结果,哪些方法不能。 在完成大量此类任务后,系统开始发现一些规律,但这并不意味着系统的思维与人类思维相似。 OpenAI 的技术人员强调,该系统仍可能犯错,并不完美,但用户可以期待它更加努力地工作,并更有可能给出正确的答案。
OpenAI o1 新技术的测试
OpenAI 表示,新技术在一些标准化测试中的表现优于以前的技术。
在测试中,新版模型在具有挑战性的物理、化学和生物基准测试中的表现达到了研究生水平。 该模型在数学和编程方面也表现出色。 在 AIME 2024 考试中,GPT-4o 模型平均只能解决 12% 的问题(1.8/15)。 相比之下,o1 模型在每个问题采用一种方法的情况下,解题率达到 74% (11.1/15);在 64 次尝试中达成共识的情况下,解题率达到 83% (12.5/15);在使用所学评分函数对 1000 次尝试进行重新排序时,解题率达到 93% (13.9/15)。 13.9 的得分使该学生跻身全国前 500 名,并超过了美国数学奥林匹克竞赛的及格分数。
在 2024 年国际信息学奥林匹克竞赛(IOI)中,由 o1 初始化并增强编程的模型获得了 213 分,排名第 49 位。 在实际比赛条件下,参赛者需要花费 10 个小时来解决 6 个算法问题,每个问题需要尝试 50 次。 根据公开测试和生成测试对应用程序进行评分。 如果随机选择答案,平均得分只有 156 分,这表明所应用的策略在激烈的竞争环境中增加了近 60 分。 在对尝试次数进行软化限制的情况下,该模型获得了 362.14 分,超过了金牌门槛。 在 Codeforces 平台上,GPT-4o 模型获得了 Elo3 808 分,相当于人类的第 11 百分位数。
使用新的 ChatGPT
订购 ChatGPT Plus 和 ChatGPT Teams 服务的消费者和公司可于 9 月 12 日开始使用这项新技术。 该公司还向软件开发商和建立了自己的人工智能应用程序的公司出售这项技术。
ChatGPT Enterprise 和 Edu 用户将从 9 月 16 日开始使用这两种模型。 OpenAI 计划向所有免费 ChatGPT 用户提供 o1-mini 的访问权限,但具体发布日期尚未确定。
开发者访问 o1 的费用很高:o1-preview API 的收费为:100 万个入站代币 15 美元,100 万个出站代币 60 美元。 相比之下,使用 GPT-4o 的费用为:100 万个入站代币 5 美元,100 万个出站代币 15 美元。
科学家和研究人员的新机遇
新的 OpenAI o1 技术为研究人员和科学家带来了许多新机遇,其中包括
- 通过快速解决复杂问题,科学家将能够更快地分析和找到正确的解决方案。 此外,由于采用了新技术,大量数据的处理速度可以更快,从而在开展研究时节省大量时间。
- 文献综述优化。 该模型可快速处理大量科学资料来源,帮助创建高质量的文献综述,从而节省科学家准备文章和研究的时间。
- 提高文本质量。 ChatGPT o1 可以让作者更好、更准确地编辑科技论文文本,纠正错误并提出建议,以提高文本质量。 这对那些用外语撰写论文的作者尤为重要。
o1 及其后续版本将为人工智能在科学领域的应用开辟许多新的可能性,尤其是在编码、数学和相关领域。 用户和开发人员很快就会发现它能如何改善他们的日常工作。
OpenAI 的新技术使研究准备和科学论文撰写更加高效。 然而,我们应该记住,它并不完美,也可能犯错。 虽然 ChatGPT 等工具在撰写文章时非常有用,但它们永远无法完全取代作者的个人贡献。