モデル提供でカスタム Python ライブラリを使用する

この記事では、モデルをログに記録するときに、プライベートミラーサーバーのカスタムライブラリまたはライブラリを含める方法について説明します。これにより、モデルのデプロイ Mosaic AI Model Serving で使用できます。トレーニング済みの ML モデルをデプロイする準備ができた後、ただし、Azure Databricks モデルの提供のエンドポイントを作成する前に、このガイドで詳しく説明されている手順を完了する必要があります。

モデル開発では、多くの場合、前処理または後処理、カスタムモデル定義、およびその他の共有ユーティリティ用の関数を含むカスタム Python ライブラリを使用する必要があります。さらに、多くのエンタープライズセキュリティチームは、サプライチェーン攻撃のリスクを軽減するために、Nexus や Artifactory などのプライベート PyPi ミラーの使用を推奨しています。 Azure Databricks では、Azure Databricks ワークスペース内のプライベートミラーからカスタムライブラリとライブラリをインストールするためのネイティブサポートが提供されます。

必要条件

MLflow 1.29 以上

ネットワークポリシーを構成して、モデルサービスエンドポイントからの送信ネットワークアクセスを制限します。モデルサービスを使用した検証を参照してください。

オプション 1: プライベートパッケージリポジトリを使用する

組織でプライベート PyPI ミラー (Nexus や Artifactory など) を使用する場合は、オプション 1 を使用します。ワークスペース管理者は、ワークスペースの既定のパッケージリポジトリとして構成できます。モデルサービスでは、モデル環境を構築するときに、このワークスペースレベルの構成が自動的に使用されます。

プライベートパッケージリポジトリを設定するには、「既定の Python パッケージリポジトリを構成する」を参照してください。

構成したら、モデルを提供するに進みます。

オプション 2: カスタムライブラリをホイールファイルとしてパッケージ化する

プライベート PyPI ミラーにアクセスできない場合、またはパッケージリポジトリで使用できないカスタムライブラリがある場合は、オプション 2 を使用します。 Python ホイールファイルとしてパッケージ化し、モデルのログ記録時にそれらを含めることができます。

手順 1: 依存関係ファイルをアップロードする

Databricks では、依存関係ファイルを Unity Catalog ボリュームにアップロードすることをお勧めします。または、Azure Databricks UI を使用して Databricks ファイルシステム (DBFS) にアップロードすることもできます。

ノートブックでライブラリを使用できるようにするには、%pip を使用してライブラリをインストールする必要があります。 %pip を使用すると、現在のノートブックにライブラリがインストールされ、依存関係がクラスターにダウンロードされます。

ステップ 2: カスタムライブラリを使用してモデルをログに記録する

ライブラリをインストールし、Python wheel ファイルを Unity Catalog ボリュームまたは DBFS にアップロードした後、スクリプトに次のコードを含めます。 extra_pip_requirements で、依存関係ファイルのパスを指定します。

mlflow.sklearn.log_model(model, "sklearn-model", extra_pip_requirements=["/volume/path/to/dependency.whl"])

DBFS の場合は、次を使用します。

mlflow.sklearn.log_model(model, "sklearn-model", extra_pip_requirements=["/dbfs/path/to/dependency.whl"])

カスタムライブラリがある場合は、ログを構成するときに、モデルに関連付けられているすべてのカスタム Python ライブラリを指定する必要があります。 extra_pip_requirementsまたはconda_envのパラメーターをlog_model()で使用できます。

重要

DBFS を使用する場合、/ をログに記録するときに dbfs パスの前にスラッシュ (extra_pip_requirements) を必ず含めてください。 DBFS パスの詳細については、「Azure Databricks 上のファイルを操作する」をご覧ください。

from mlflow.utils.environment import _mlflow_conda_env

mlflow.pyfunc.log_model(
    name="model",
    python_model=MyModel(),
    extra_pip_requirements=["/volumes/path/to/dependency"],
)

カスタムライブラリがボリュームまたは DBFS 以外の場所に格納されている場合は、code_paths パラメーターを使用してその場所を指定し、"code/<wheel-file-name>.whl" パラメーターにextra_pip_requirementsを渡すことができます。

mlflow.pyfunc.log_model(
    name="model",
    python_model=MyModel(),
    code_paths=["/path/to/dependency.whl"], # This will be logged as `code/dependency.whl`
    extra_pip_requirements=["code/dependency.whl"],
)

ステップ 3: Python ホイールを使用して MLflow モデルを更新する

MLflow は、Python ホイールファイルとして事前にパッケージ化されたすべての依存関係を使用してモデルをログする add_libraries_to_model() ユーティリティを提供します。これにより、モデルの依存関係として指定されている他のすべての ライブラリに加えて、カスタムライブラリがモデルと共にパッケージ化されます。これにより、モデルで使用されるライブラリが、まさにトレーニング環境からアクセスできるライブラリであることを保証します。

次の例では、model_uri 構文 models:/<uc-model>/<model-version>を使用して Unity カタログモデルレジストリを参照します。ワークスペースモデルレジストリ（レガシー）の使用を参照するには、models:/<model-name>/<model-version>を使用します。

モデルレジストリ URI を使用すると、このユーティリティによって、既存の登録済みモデルの下に新しいバージョンが生成されます。

import mlflow.models.utils
mlflow.models.utils.add_libraries_to_model(<model-uri>)

モデルを提供する

パッケージを含む新しいモデルバージョンがモデルレジストリで使用可能な場合は、モデル提供を使用してこのモデルバージョンをエンドポイントに追加できます。

パッケージのインストールエラーのトラブルシューティング

ビルドフェーズ中にモデルのデプロイが失敗した場合は、ビルドログを確認してパッケージのインストールの問題を特定できます。

Databricks ワークスペースの [ サービス ] ページに移動します。
エンドポイント名をクリックして、エンドポイントの詳細を開きます。
[ ログ ] タブをクリックします。
ドロップダウンメニューから失敗したバージョンを選択します。
[ ログのビルド] をクリックします。

エラーメッセージを確認して問題を特定します。プライベートパッケージリポジトリを使用している場合、一般的な問題は次のとおりです。

不足しているパッケージ: 構成済みのリポジトリでパッケージを使用できません。必要なパッケージをプライベートリポジトリに追加します。
接続の問題: モデルサービスがパッケージリポジトリに到達できません。ネットワーク接続とファイアウォール規則を確認します。
認証エラー: リポジトリ用に構成された資格情報が無効であるか、有効期限が切れています。ワークスペース構成のシークレットを更新します。

問題を解決したら、新しいデプロイを作成するか、エンドポイントを更新して新しいビルドをトリガーします。

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-02-14

次の方法で共有