このチュートリアルでは、Lakehouse を構築し、サンプル データをデルタ テーブルに取り込み、必要に応じて変換を適用してから、レポートを作成します。
ヒント
このチュートリアルはシリーズの一部です。 このチュートリアルを完了したら、引き続き Lakehouse にデータを取り込み 、Data Factory パイプライン、Spark ノートブック、高度なレポート手法を使用して完全なエンタープライズ Lakehouse を構築します。
このチュートリアルで完了する手順のチェックリストを次に示します。
Microsoft Fabric をお持ちでない場合は、無料 試用版の容量にサインアップしてください。
前提条件
- Lakehouse を作成する前に、Fabric ワークスペースを作成する必要があります。
- CSV ファイルを取り込む前に、OneDrive を構成しておく必要があります。 OneDrive が構成されていない場合は、Microsoft 365 無料試用版にサインアップします: 無料試用版 - Microsoft 365 を 1 か月間試します。 セットアップ手順については、「 OneDrive のセットアップ」を参照してください。
このチュートリアルに OneDrive が必要な理由
データ インジェスト プロセスはファイルアップロードの基になるストレージ メカニズムとして OneDrive に依存するため、このチュートリアルには OneDrive が必要です。 CSV ファイルを Fabric にアップロードすると、レイクハウスに取り込まれる前に、一時的に OneDrive アカウントに保存されます。 この統合により、Microsoft 365 エコシステム内での安全でシームレスなファイル転送が保証されます。
アップロードされたファイルに Fabric がアクセスできないため、OneDrive を構成していない場合、インジェスト手順は機能しません。 レイクハウスまたはサポートされている別の場所でデータを既に使用できる場合、OneDrive は必要ありません。
注意
Lakehouse に既にデータがある場合は、サンプル CSV ファイルの代わりにそのデータを使用できます。 データが既に Lakehouse に関連付けられているかどうかを確認するには、Lakehouse Explorer または SQL 分析エンドポイントを使用して、テーブル、ファイル、フォルダーを参照します。 確認方法の詳細については、「 Lakehouse の概要 」および 「SQL 分析エンドポイントを使用して lakehouse テーブルにクエリを実行する」を参照してください。
レイクハウスを作成する
このセクションでは、Fabric で lakehouse を作成します。
Fabric で、ナビゲーション バーから [ワークスペース]選択します。 ワークスペースを開くには、上部にある検索ボックスにその名前を入力し、検索結果から選択します。
ワークスペースから [ 新しいアイテム] を選択し、検索ボックスに 「Lakehouse 」と入力し、[ Lakehouse] を選択します。
[新しいレイクハウス] ダイアログ ボックスの [名前] フィールドに「wwilakehouse」 と入力します。
[作成] を 選択して、新しいレイクハウスを作成して開きます。
サンプル データを取り込む
このセクションでは、サンプル顧客データをレイクハウスに取り込みます。
注意
OneDrive が構成されていない場合は、Microsoft 365 無料試用版にサインアップします: 無料試用版 - Microsoft 365 を 1 か月間試します。
Fabric サンプル リポジトリから dimension_customer.csv ファイルをダウンロードします。
Lakehouse を選択し、[ ホーム ] タブに移動します。
[ データの取得>新しいデータフロー Gen2 を選択して新しいデータフローを作成します。 このデータフローを使用して、サンプル データを lakehouse に取り込みます。 または、 Lakehouse の [データの取得] で[ 新しいデータフロー Gen2 ] タイルを選択することもできます。
[新しいデータフロー Gen2] ウィンドウで、[名前] フィールドに「Customer Dimension Data」と入力し、[作成] を選択します。
[データフロー ホーム ] タブで、[ テキスト/CSV ファイルからインポート ] タイルを選択します。
[データ ソースに接続] 画面で、[ファイルのアップロード] ラジオ ボタンを選択します。
手順 1 でダウンロードした dimension_customer.csv ファイルを参照またはドラッグ アンド ドロップします。 ファイルがアップロードされたら、[次へ] を選択します。
[ ファイル データのプレビュー ] ページで、データをプレビューできます。 次に、[ 作成 ] を選択して続行し、データフロー キャンバスに戻ります。
データを変換してレイクハウスにロードする
このセクションでは、ビジネス要件に基づいてデータを変換し、Lakehouse に読み込みます。
[ クエリ設定 ] ウィンドウで、[ 名前 ] フィールドが dimension_customer に設定されていることを確認します。 この名前はレイクハウス内のテーブル名として使用されるため、小文字で、スペースを含めることはできません。
レイクハウスからデータフローを作成したため、データの宛先は自動的にあなたのレイクハウスに設定されます。 これを確認するには、クエリ設定ペインで [データの変換先 ] をオンにします。
ヒント
レイクハウスではなくワークスペースからデータフローを作成する場合は、データ変換先を手動で追加する必要があります。 詳細については、「 Dataflow Gen2 の既定の変換先 と データの宛先と管理設定」を参照してください。
データフロー キャンバスから、ビジネス要件に基づいてデータを簡単に変換できます。 わかりやすくするために、このチュートリアルでは何も変更しません。 続行するには、ツール バーで [保存して実行 ] を選択します。
データフローの実行が完了するまで待ちます。 進行中は、回転するステータスインジケーターが表示されます。
データフローの実行が正常に完了したら、上部のメニュー バーで lakehouse を選択して開きます。
lakehouse エクスプローラーで テーブル の中にある dbo スキーマを見つけ、その横にある ... (省略記号) メニューを選択し、更新 を選択します。 これにより、データフローが実行され、ソース ファイルから lakehouse テーブルにデータが読み込まれます。
更新が完了したら、 dbo スキーマを展開して 、dimension_customer Delta テーブルを表示します。 テーブルを選択してデータをプレビューします。
lakehouse の SQL 分析エンドポイントを使用して、SQL ステートメントを使用してデータのクエリを実行できます。 画面の右上にあるドロップダウン メニューから SQL 分析エンドポイント を選択します。
dimension_customer テーブルを選択して、そのデータをプレビューします。 SQL ステートメントを記述するには、メニューから [新しい SQL クエリ ] を選択するか、[ 新しい SQL クエリ] タイルを選択します。
dimension_customer テーブルの BuyingGroup 列に基づいて行数を集計する次のサンプル クエリを入力します。
SELECT BuyingGroup, Count(*) AS Total FROM dimension_customer GROUP BY BuyingGroup注意
SQL クエリ ファイルは将来参照するために自動的に保存され、必要に応じてこれらのファイルの名前を変更または削除できます。
スクリプトを実行するには、スクリプト ファイルの上部にある [実行] アイコンを選択します。
セマンティック モデルにテーブルを追加する
このセクションでは、セマンティック モデルにテーブルを追加して、それらを使用してレポートを作成できるようにします。
レイクハウスを開き、SQL 分析エンドポイント ビューに切り替えます。
[ 新しいセマンティック モデル] を選択します。
[ 新しいセマンティック モデル ] ウィンドウで、セマンティック モデルの名前を入力し、ワークスペースを割り当てて、追加するテーブルを選択します。 この場合は、dimension_customer テーブルを選択します。
セマンティック モデルを作成するには、[ 確認 ] を選択します。
Warnung
組織の Fabric コンピューティング容量が制限を超えたために"テーブルを追加または削除できませんでした" というエラー メッセージが表示された場合は、数分待ってからやり直してください。 詳細については、 Fabric の容量に関するドキュメントを参照してください。
セマンティック モデルは Direct Lake ストレージ モードで作成されます。つまり、OneLake の Delta テーブルから直接データを読み取り、データをインポートしなくても高速なクエリ パフォーマンスを実現します。 作成後、セマンティック モデルを編集して、リレーションシップ、メジャーなどを追加できます。
ヒント
Direct Lake とその利点の詳細については、 Direct Lake の概要に関するページを参照してください。
レポートを作成する
このセクションでは、作成したセマンティック モデルからレポートを作成します。
ワークスペースで、作成したセマンティック モデルを見つけ、 ... (省略記号) メニューを選択して、[ レポートの自動作成] を選択します。
テーブルは次元であり、測度はありません。 Power BI では、行数のメジャーが作成され、さまざまな列に集計され、次のスクリーンショットに示すように異なるグラフが作成されます。
このレポートは、上部のリボンから [保存] を選択することで、今後のために保存できます。 他のテーブルまたは列を含めたり除外したりすることで、要件を満たすためにこのレポートにさらに変更を加えることができます。