OpenAI o1模型：偏科的理科生

2024/9/14 23:03:20

本文主要是介绍OpenAI o1模型：偏科的理科生，对大家解决编程问题具有一定的参考价值，需要的程序猿们随着小编来一起学习吧！

LLM需要增强的地方

大模型的三大基础能力：

o1模型增强逻辑推理能力的思路是：收到问题后，自动生成CoT，再生成答案。避免人类写基于于CoT的Prompt。

如果让o1获取自动生成CoT的能力，通过强化学习提升模型自动找到正确推理路径的能力。

OpenAI发现：在强化学习的训练和推理过程中，随着计算能力的增加，模型推理效果（如找到正确CoT路径的概率）也会提高。这可能找到RL Scaling。可能不断增强计算能力，有可能进一步增强模型的逻辑推理能力。这可能是一种新的范式。

由于增强了逻辑推理能力，o1模型适合编程、数学、物理等场景。但写文章可能反而会差点。有点像偏科的理科生。

我的感觉，o1模型与sonnet 3.5模型在编程上，没有拉开明显的差距。

OpenAI应该是会推出一系列“逻辑推理能力更强，更偏科”的模型。

o1系列模型还没完全产品化，不支持视觉，不支持流式输出，不支持Function Call等。因此才叫preview。

o1-preview价格是GPT-4o的4倍。

另外，推理过程中，产生的隐藏Prompt（CoT）也要占用Token。这也会变相增加成本。

这篇关于OpenAI o1模型：偏科的理科生的文章就介绍到这儿，希望我们推荐的文章对大家有所帮助，也希望大家多多支持为之网！