没有一点点防备,OpenAI造势已久的“草莓”(Strawberry)模型,澳门新葡萄新京平台就这样发布了。
北京时间今天凌晨,OpenAI发布了名为OpenAI o1的新模型,也是之前所传的“Strawberry”,但最初o1的代号为“Q*”。OpenAI的CEO萨姆奥尔特曼(Sam Altman)则称它为“新范式的开始”。
从OpenAI的官方信息看下来,总结o1的特点就是:更大、更强、更慢、更贵。
经过强化学习(Reinforcement Learning),OpenAI o1在推理能力方面取得了重大进展。研发团队观察到,随着训练时间(强化学习的增加)和思考时间(测试时的计算)的延长,o1模型的表现逐渐提升。这种方法的扩展所面临的挑战与大型语言模型(LLM)的预训练限制截然不同。
关于市面上所传“o1模型能够自主为用户执行浏览器或系统操作级别的任务”,目前的公开信息并未提及这一功能。
OpenAI官方表示:“虽然这款初期模型还没有像网上搜索信息、上传文件和图片这样的功能,但它在解决复杂推理问题上有了显著进步,这代表了人工智能技术的新水平。所以我们决定给这个系列一个新的起点,将其命名为OpenAI o1。”由此可见,o1的主要应用还是集中在通过文本交互进行问题解答和分析,而不是直接控制浏览器或操作系统。
与早期版本不同,o1模型在作出回答之前会像人类一样“深思熟虑”,用时约10—20秒,产生一个长长的内部思路链,并能够尝试不同的策略并识别自身的错误。
这种强大推理能力使o1在多个行业中具有广泛的应用潜力,尤其是复杂的科学、数学和编程任务。在处理物理、化学和生物问题时,澳门新葡萄新京平台o1的表现甚至和该领域的博士生水平不相上下。在国际数学奥林匹克的资格考试(AIME)中,o1的正确率为83%,成功进入了美国前500名学生的行列,而GPT-4o模型的正确率仅为13%。
OpenAI提供了一些具体的使用案例,比如医疗研究人员可利o1来标注细胞测序数据;物理学家可用o1生成量子光学所需的复杂数学公式;软件开发者则可以借助它来构建和执行复杂的多步骤工作流程等。
OpenAI o1-preview:这个版本更注重深度推理处理,每周可以使用30次。
OpenAI o1-mini:这个版本更高效、划算,适用于编码任务,每周可以使用50次。
开发者和研究人员现在可以通过ChatGPT和应用程序编程接口访问这些模型。
至于价格,早先The information曾爆料,OpenAI高管正在讨论其即将推出的全新大模型“草莓”(Strawberry)和“猎户座”(Orion)的拟定在2000美元一个月,引发一众吐槽和声讨。但今日有人发现,ChatGPT Pro会员已经上线美元的落差,很难让人不产生一种“占便宜”的感觉,价格心理战被OpenAI玩转得明明白白。
今年5月,奥尔特曼在于麻省理工学院校长莎莉科恩布鲁斯(Sally Kornbluth)炉边谈线或将数据与推理引擎分离。
但实际上,模型在处理数据时浪费了许多数据资源。比如GPT-4。它也能像数据库一样工作,只是推理速度慢、成本高昂且效果“不尽如人意”。这些问题本质上是因为模型的设计和训练方式导致的资源浪费。
至于价格,早先The information曾爆料,OpenAI高管拟将推出的全新大模型“草莓”(Strawberry)和“猎户座”(Orion)的价格定在2000美元/月,这引发一众吐槽和声讨。但今日有人发现,ChatGPT Pro会员已经上线美元的落差,很难不让用户产生一种“占便宜”的感觉,价格心理战实属被OpenAI玩转得明明白白。
比如逻辑推断、数学问题解决或编程等。如果我们想要走出一个迷宫,就需要遵循一系列逻辑和空间规则才能找到出口。这类问题要求模型能够理解并应用一系列固定的步骤或规则,但这正是大部分大模型所缺乏的。
要知道,大模型在处理非结构化的自然语言文本时表现出色,原于这正是训练数据的侧重点。但当涉及到需要结构化逻辑推理的任务时,它们往往难以表现得像人类一样精确。
思维链是一种帮助AI模型进行推理的技术。它通过让模型在回答复杂问题时,逐步解释每一步的推理过程,而不是直接给出答案。因此模型在回答问题时就像是人类在解题时那样,先思考每一步的逻辑,再逐步推导出最终的结果。
8月,OpenAI联合创始人、研究科学家约翰舒尔曼(John Schulman)透露了自己的离职,并加入Anthropic专注于AI对齐的深入研究。他解释说,离职是为了聚焦于AI对齐和技术工作,并非因为OpenAI不支持对齐研究。舒尔曼感谢了在OpenAI的同事,并对它未来的发展“充满信心”。
OpenAI研究员丹尼尔科科塔洛(Daniel Kokotajlo)在离职后接受媒体专访时表示,去年发生的“宫斗”事件中,奥尔特曼被短暂解雇后迅速复职,专注于AGI安全的三名董事会成员被撤换。“这使得奥尔特曼和布罗克曼进一步巩固了权力,而主要关注AGI安全的人被边缘化。(奥尔特曼)他们背离了公司在2022年制定的计划”。
此外,OpenAI面临高达50亿美元的预计亏损,运营成本高达85亿美元,其中大部分为服务器租用和训练成本。为应对高昂的运营压力,OpenAI正在谋求新一轮融资,估值可能超过1000亿美元,微软、苹果和英伟达等潜在投资者表达了兴趣。公司高管正在全球范围内寻求投资以支持其快速发展的资金需求。
但有外媒援引知情人士以及未公开的内部财务数据分析称,OpenAI今年可能面临高达50亿美元的巨额亏损,总运营成本预计达到85亿美元。其中向微软租用服务器的费用高达40亿美元,数据训练成本则是30亿美元。由于更先进的模型如Strawberry和Orion的运行成本更高,公司的经济压力进一步加大。