OpenAIの強化ファインチューニングの研究プログラムの紹介

12 Days of OpenAIの2日目の記事を紹介します。

OpenAIは、2024年12月6日(現地時間)に、開発者や機械学習エンジニアが法律、保険、医療、金融、工学などの特定の複雑で専門的なタスクに特化したモデルを作成できる、強化ファインチューニング研究プログラムを発表しました。

12 Days of OpenAI | OpenAI

強化ファインチューニングとは?

記事によると、強化ファインチューニングとは、数十~数千の準備されたタスクを使って、提供された参照回答でモデルの応答を評価することで、モデルのカスタマイズが可能になる手法のようです。この技術は、類似した問題に対するモデルの推論方法が強化されることで、特定のタスクでの正確性が向上するようです。

つまり、特定タスクにモデルを最適化するための技術のように見えますね。

表記から考えると、少なくとも用意されたタスクの類似タスクについては、回答精度が上がりそうですね。法律、保険、医療、金融、工学の分野で有効性が確認できているということなので、これらのドメインのタスクが準備されている可能性が高そうです。

誰でも使えるのか?

現時点では、だれでも使えるわけではなく、利用には応募が必要になるようです。

想定している応募対象としては、AIの支援から利益を得られる研究機関、大学、企業を特に対象としているとのことです。

まとめ

OpenAIが新しく公開したOpenAIの強化ファインチューニングの研究プログラムの紹介について紹介しました。

特定タスクについて精度の良い回答が期待できそうですね。

現時点では、一般に公開される時期はわかりませんが、早期利用したい場合は応募が必要になります。

一般公開が楽しみですし、利用料と回答精度によっては、自分のプロジェクトに使ってみたい機能です。