HawkInsight

  • お問い合わせ
  • App
  • 日本語

OpenAI、新推論モデルで博士レベルの知能を実現

OpenAIは9月12日、課題を解決するための新しい推理モデルのシリーズを発表した。このシリーズの最初のモデルはOpenAI o 1で、そのプレビュー版は即日使用を開始した。

OpenAIは9月12日、課題を解決するための新しい推理モデルのシリーズを発表した。このシリーズの最初のモデルはOpenAI o 1で、そのプレビュー版は即日使用を開始した。

OpenAIによると、o 1モデルはこれまでのモデルよりも複雑なタスクを推理し、従来の科学、符号化、数学モデルよりも難しい問題を解決できるという。

「これらのモデルはより多くの時間をかけて問題を考え、それから反応し、人間のようになる」とOpenAIは紹介している。「訓練を通じて、彼らは自分の思考過程を改善し、異なる戦略を試し、自分の誤りを認識することを学ぶ」。

「o 1」モデルの強さはどれくらいですか。

o 1モデルはどれだけすごいのか。このモデルはプログラミング能力コンテストCodeforcesで89%の成績を獲得し、2024米国数学招待試合(American Invitational Mathematics Examinatio、AIME)予選で83.3%の正確率を獲得し、米国の上位500人の学生の列に入った。

対照的に、GPT-4 oはCodeforcesで11%の成績しか得られず、AIMEでの正確率は13.4%にとどまった。

また、大学院レベルのグーグル問答基準テストであるGPQA(Grade School Physics Question Answering)においても、o 1モデルの表現は驚くべきものだった。GPQAは、数百の生物学、物理学、化学分野の専門家が作成した複数の選択問題を含む挑戦的なデータセットである。

一般的に、対応する分野で博士号を取得しているか、取得している専門家のGPQAでの精度は70%前後であるが、o 1モデルはこのテストで78%の精度に達しており、つまり、o 1モデルは人類博士課程生のレベルに達している。

上記のような難易度の高いテストに加えて、広範なベンチマークテストの中には、o 1モデルの表現もGPT-4 oより優れているものもあります。例えば、大規模マルチタスク言語理解(MMLU)テストの57サブカテゴリのうち、o 1モデルはGPT-4 oより54サブカテゴリが優れている。

o 1モデルのより強力な推論能力のおかげで、コードや数学などの推論能力の高い問題への回答もより良い。

OpenAIによると、人間選好評価では、o 1-previewとGPT-4 oが提供する匿名回答に対して、人間トレーナーはo 1プレビュー版の回答を好む。特にデータ分析、符号化、数学などの推理力の強いカテゴリでは、o 1プレビュー版の人気プログラムはgpt-4 oよりはるかに高い。しかし、o 1プレビュー版はいくつかの自然言語タスクでやや見劣りしており、このモデルがすべての使用に適していないことを示しています。

より強く、より高価です。

広範な常識を必要とする複雑なタスクに対して設計された新しい推論モデルとして、o 1モデルの価格は通常モデルよりずっと高い。

OpenAI公式サイトによると、o 1プレビュー版モデルの100万入力tokensあたりの価格は15ドルで、100万出力tokensあたりの価格は60ドルで、それぞれGPT-4 oの3倍と4倍である。

OpenAIによると、o 1モデルは科学、コーディング、数学、類似分野の複雑な問題を解決しているユーザーに適しているという。例えば、医療研究者は細胞配列決定データにo 1モデルを用いて注釈することができ、物理学者はo 1モデルを用いて量子光学に必要な複雑な数式などを生成することができる。しかし、OpenAIもより安価なバージョン、o 1-miniを提供しています。

o 1-miniは、コーディング、数学、科学などの使用状況に特化した、より高速で低コストな推理モデルです。小さなモデルとして、o 1-miniはo 1プレビュー版モデルより80%安い。

o 1プレビュー版にもo 1-miniにも、128 Kコンテキストウィンドウがあり、その知識は2023年10月までです。

ChatGPTプラスとチームのユーザーは、9月12日からo1プレビューとo1-miniにアクセスできるようになります。openAIは、同社がChatGPTのすべての無料ユーザーにo1-miniへのアクセスを提供することによってフォローアップすることを計画していると述べましたが、正確な日付はまだ決定されていません。

現在のo1モデルの推論能力は比較的遅く、使用するにはコストがかかるが、AI研究者にとって推論を解読することは人間の知能に近づく重要な一歩である。 研究者たちは、モデルの能力がパターン認識に限定されなければ、医学や工学などの分野でのブレークスルーにつながると考えている。

「我々は推論に何ヶ月も費やしてきました。 OpenAIの最高研究責任者であるボブ・マックグルーは、インタビューの中で、「基本的には、人間と同様の知能レベルを達成するために、本当に難しい問題を解決することができる新しいモデルのパラダイムです。」と語った。

·原著

免責事項: この記事の見解は元の著者の見解であり、Hawk Insight の見解や立場を表すものではありません。記事の内容は参考、コミュニケーション、学習のみを目的としており、投資アドバイスを構成するものではありません。著作権上問題がある場合は削除のご連絡をお願い致します。