Azure AIがGPT-4.1の微調整速度とパーソナライゼーションを強化

Azure AIがGPT-4.1の微調整速度とパーソナライゼーションを強化

マイクロソフト、Azure AI Foundry を直接的な嗜好最適化で強化

Microsoftは、Azure AI Foundryポータルに加え、Azure OpenAI Service APIおよびSDKにも大幅な進化を遂げました。最新のアップデートでは、GPT-4.1とGPT-4.1-miniの両方にDirect Preference Optimization(DPO)が導入されました。この革新的な微調整アプローチにより、ユーザーの好みに基づいてモデルの重みを調整することが可能になり、好ましい応答と好ましくない応答の比較が可能になります。

直接選好最適化の利点

DPOは、従来の人間によるフィードバックからの強化学習(RLHF)に代わる魅力的な選択肢です。その主な利点の一つは、計算能力と時間を大幅に削減しながら、モデルをユーザーの期待に効果的に適合させることができることです。組織は、この手法を活用してモデルを微調整し、独自のブランドアイデンティティ、安全基準、会話のニュアンスをより適切に反映させることができます。

グローバルトレーニングの拡大

DPO統合に加え、MicrosoftはAzure AI Global Training機能を12のリージョンに拡張しました。この拡張には、米国東部、西ヨーロッパ、英国南部、スイス北部などの地域が含まれます。ただし、この取り組みはまだパブリックプレビュー段階であることにご注意ください。

今後の展望: 今後の機能

Microsoftは、プロセスの一時停止と再開機能や継続的な微調整をサポートする機能など、ユーザーエクスペリエンスを向上させる今後の機能の導入を予定しています。さらに、新たに追加されたリージョンへのGPT-4.1-nanoの導入も間近に迫っています。

データ主権とプライバシーに関する考慮事項

グローバルトレーニングの拡大は、データ主権の観点から特に重要です。欧州連合(EU)が欧州におけるローカライズされたデータ管理を推進する最近の動きを受け、プライバシーとコンプライアンスの強化はこれまで以上に重要になっています。

レスポンスAPIの導入

開発者の利便性をさらに高めるため、Microsoftは、微調整されたモデル向けにカスタマイズされた新しいResponses APIをリリースしました。このAPIは、様々なアプリケーションとの統合性を高め、特にステートフルでマルチターンの会話を必要とするワークフローに有効です。Microsoftによると、Responses APIは「バックグラウンドですべてを自動的につなぎ合わせ」、ユーザーエクスペリエンスを合理化します。

レスポンスAPIの主な機能

この API は、次のようなさまざまな機能を提供します。

  • 会話の一貫性を高めるためのコンテキスト保持。
  • 回答生成中のモデル推論の透明性。
  • 応答が作成されるときのユーザーの進捗状況の追跡。
  • バックグラウンド処理のサポートと、Web 検索やファイル検索などのツールとの統合。

これらの更新の詳細については、Azure AI サービスに関する Microsoft の公式ブログ投稿をご覧ください。

Depositphotos.comより画像提供

出典と画像

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です