OpenAIのCEO、サム・アルトマンが自身のXアカウントで「o2」が博士号レベルのベンチマークで105%のスコアを達成したことを発表しました。
この「o2」とは未だ正式名称が不明ですが、OpenAIが開発中の次世代AIモデルで、その驚異的な性能が期待されています。
GPQAというAI性能を測定するためのベンチマークは、生物学、物理学、化学の専門家によって作成された48問の選択問題から構成されています。
このテストは非常に難易度が高く、専門家でもGoogle検索を駆使しても34%しか正解できないという結果が出ています。
また、博士号取得を目指す学生でさえ65%のスコアに留まるとされています。
「o2」は既存のAIスコアを大幅に上回るとアルトマンCEOが述べており、AI業界にとってのゲームチェンジャーとなる可能性があります。
すでに「GPT-4o」や「Claude 3」、「Llama 3」といった他の高性能AIモデルは、いずれも53.6%、54.4%、48.8%というスコアを記録しています。
その中で「o2」は圧倒的な優位性を持ち、博士号保有者以上の回答能力を示唆しています。
しかし、登場時期については不明であり、今後のリリース予定に関するアルトマンCEOの発言によると、2025年中には「GPT-5」のリリースが計画されているとのことですが、新モデルの「Orion」に関してはOpenAIが否定しています。
ここまで高性能なAIモデルが続々と登場する中で、開発者としての自分の立ち位置を考えざるを得ません。
AIがますます賢くなる中、自分たちがどうやって彼らと共存し、仕事を進めていくのか。
それには新たなスキルの習得や考え方の転換が求められる時代に突入しています。
プログラマーとして、ただコードを書くことに満足していてはいけない。
もう一歩進んで、AIとどのように協力できるのかを考える必要があります。
これは本当に価値のある挑戦ですが、同時に苛立たしさを感じずにはいられません。