OpenAIは、9月に新しい大規模言語モデル「OpenAI o1」を発表しました。
通称「Strawberry」と呼ばれるこのモデルは、特に思考プロセスにおいて優れた能力を持っています。
ChatGPT Plusのユーザーは、この新モデルのプレビュー版へのアクセスが可能です。
「OpenAI o1」は、複雑な推論を行うために強化学習を用いて訓練され、従来のGPT-4oとは異なるアプローチを取っています。
具体的には、「思考の連鎖」(Chain-of-Thought)を駆使してクエリを処理します。
この技術により、新たなクラスの機能と性能を提供し、最適化アルゴリズムやデータセットの調整を通じて進化を遂げました。
o1は、専門家と匹敵するパフォーマンスを示し、数学や物理などの難易度の高い分野でも顕著な成果を上げています。
例えば、米国の数学オリンピック予選(AIME)では、上位5%にランクインする結果を出しました。
一方で、実世界の知識においてはまだ改善の余地があり、一部の分野ではGPT-4oに劣ることもあります。
新モデルは、問題を段階的に分解し、思考プロセスを可視化する機能を持っています。
これにより、ユーザーは段階的思考を通じて質の高い回答を得ることができ、誤答を減らす効果があります。
しかし、考え続ける時間が長くなる場合が多く、その点は改善が望まれるでしょう。
料金面では、OpenAI o1のAPI利用には高額なコストがかかりますが、その分、STEM(科学・技術・工学・数学)分野での優れた推論能力を備えています。
「OpenAI o1 – mini」は、小型モデルながらも優れたパフォーマンスを発揮し、コスト対効果の高い選択肢として注目されています。
OpenAIがどのような挑戦を乗り越え、未来の新しい領域にどれほど進化していくのか、技術者の視点からも興味深いです。
ただ、特定のアルゴリズムやデータセットの選択がどのように性能に影響しているのかを明確に理解することは、今後の課題として残されています。