Notebook アクティビティを使用して、Data Factory パイプラインの一部として Microsoft Fabric で作成した ノートブック を実行します。 ノートブック を使用すると、Apache Spark ジョブを実行して、データ ワークフローの一部としてデータを取り込んだり、クリーンアップしたり、変換したりできます。 Fabric のパイプラインに Notebook アクティビティを簡単に追加できます。このガイドでは、各手順について説明します。
前提条件
開始するには、次の前提条件を満たしている必要があります。
- アクティブな Microsoft Fabric サブスクリプションを持つテナント アカウント。 無料試用版で Fabric を試すことができます。
- ファブリック ワークスペース。
- ワークスペースにノートブックが作成されている。 新しいノートブックを作成するには、Microsoft Fabric ノートブックを作成する方法に関する記事を参照してください。
ノートブック アクティビティを作成する
ワークスペースに新しいパイプラインを作成します。
パイプラインの [アクティビティ] ペイン内でノートブックを検索し、それを選択してパイプライン キャンバスに追加します。
まだ選択されていない場合は、キャンバスで新しいノートブック アクティビティを選択します。
[全般設定] タブを構成するには、全般設定のガイダンスを参照してください。
ノートブックの設定を構成する
[Settings](設定) タブを選択します。
[ 接続] で、ノートブックの実行の認証方法を選択し、必要な資格情報を指定します。
[ノートブック] ドロップダウンから既存のノートブックを選択し、必要に応じてノートブックに渡すパラメーターを指定します。
セッション タグを設定する
ノートブック ジョブの実行にかかる時間を最小限に抑えるために、必要に応じてセッション タグを設定できます。 セッション タグを設定すると、既存の Spark セッションを再利用するように Spark に指示され、起動時間が最小限に抑えられます。 セッション タグには任意の文字列値を使用できます。 セッションが存在しない場合は、タグ値を使用して新しいセッションが作成されます。
注
セッション タグを使用できるようにするには、複数のノートブックを実行するパイプライン用の高コンカレンシー モード オプションをオンにする必要があります。 このオプションは、[ワークスペース設定] の下にある [Spark 設定] の [高コンカレンシー モード] で確認できます
パイプラインを保存して実行またはスケジュールする
パイプライン エディターの上部にある [ ホーム ] タブに切り替え、[保存] ボタンを選択してパイプラインを保存します。 [ 実行 ] を選択して直接実行するか、特定の時間または間隔で実行をスケジュールする スケジュール を設定します。 パイプラインの実行の詳細については、「パイプラインの実行 をスケジュールする」を参照してください。
実行後、パイプラインの実行を監視し、キャンバスの下にある [出力 ] タブから実行履歴を表示できます。
既知の問題
- 接続設定の WI オプションは、一部のインスタンスでは表示されません。 これは、現時点で修正が行われているバグです。
- サービス プリンシパルを使用してセマンティック リンク コードを含むノートブックを実行するには、機能上の制限があり、セマンティック リンク機能のサブセットのみをサポートします。 詳細については、 サポートされているセマンティック リンク関数 を参照してください。 他の機能を使用するには、サービス プリンシパルを使用して セマンティック リンクを手動で認証することをお勧めします。
- 一部のお客様には、ワークスペース ID (WI) ドロップダウンが表示されない場合や、表示される場合がありますが、接続を作成できない場合があります。 この動作は、基になるプラットフォーム コンポーネントの 1 つで既知の問題が原因です。 修正プログラムは現在進行中です。