Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Ein Lakehouse in Microsoft Fabric kombiniert die Skalierbarkeit eines Data Lake mit den Abfragefunktionen eines Data Warehouse. Sie speichern strukturierte und unstrukturierte Daten an einem einzigen Ort, verwalten sie mit Delta Lake und analysieren sie mit Apache Spark und SQL – alles ohne Datenverschiebung zwischen Systemen.
Ein Seehaus gibt Ihnen:
- Eine Datenkopie für Datenengineering und Analyse-Workloads
- Delta Lake-Format für ACID-Transaktionen, Schemaerzwingung und Zeitreise
- Spark und SQL-Zugriff, sodass Dateningenieure Notebooks verwenden, während Analysten T-SQL nutzen.
- Eingebaute Integration mit Power BI, Pipelines, Datenflüssen und anderen Fabric-Elementen
Lakehouse vs. Data Warehouse
Die wichtigsten Unterschiede zwischen einem Seehaus und einem Data Warehouse in Microsoft Fabric ergeben sich aus Ihren bevorzugten Entwicklungstools, Datentypen und Arbeitsauslastungsmustern. Beide teilen dasselbe SQL-Modul und speichern Daten im Delta-Format auf OneLake, sind jedoch für verschiedene Szenarien ausgelegt:
| Lakehouse | Datenlager | |
|---|---|---|
| Primäres Entwicklungstool | Apache Spark (Python, Scala, SQL, R) | T-SQL |
| Datentypen | Strukturiert und unstrukturiert | Strukturiert |
| Transaktionen mit mehreren Tabellen | Nein | Ja |
| Dateneinbindung | Notizbücher, Pipelines, Datenflüsse, Kurzbefehle | T-SQL (COPY INTO, INSERT, CTAS), Pipelines |
| Am besten geeignet für | Data Engineering, Data Science, Medallion-Architekturen | BI-Berichterstellung, dimensionale Modellierung, SQL-zentrierte Teams |
Sie können beide im selben Arbeitsbereich verwenden – zum Beispiel durch Landung und Transformation von Daten in einem Lakehouse mit Spark und anschließend kuratierte Datensätze für ein Data Warehouse für SQL-basierte Berichte bereitstellen. Ausführliche Anleitungen finden Sie unter Wählen Sie zwischen Warehouse und Lakehouse.
Arbeiten mit Lakehouse-Daten
Sie können Daten in einem Lakehouse über mehrere Fabric-Tools laden, transformieren und abfragen:
Lakehouse-Explorer – Durchsuchen Sie Tabellen und Dateien, laden Sie Daten, und verwalten Sie Metadaten direkt im Browser. Sie können zwischen Tabellenansicht und Dateiansicht wechseln und dem Explorer mehrere Seehäuser hinzufügen. Siehe Navigate the Fabric Lakehouse Explorer.
Notizbücher – Schreiben sie Spark-Code (Python, Scala, SQL, R), um Daten in Lakehouse-Tabellen und -Ordner zu lesen, zu transformieren und zu schreiben. Siehe "Durchsuchen von Daten mit einem Notizbuch " und "Laden von Daten mit einem Notizbuch".
Pipelines – Verwenden Sie die Kopieraktivität und andere Datenintegrationstools, um Daten aus externen Quellen in das Seehaus abzurufen. Siehe Kopieren von Daten mithilfe der Kopieraktivität.
Spark-Auftragsdefinitionen – Ausführen kompilierter Spark-Anwendungen in Java, Scala oder Python für ETL der Produktionsklasse. Sehen Sie sich an, was eine Apache Spark-Auftragsdefinition ist?.
Dataflows Gen 2 – Aufnehmen und Vorbereiten von Daten mit einer Low-Code-, visuellen Schnittstelle. Siehe Erstellen des ersten Datenflusses.
Einen vollständigen Vergleich der Aufnahmeoptionen finden Sie unter "Optionen", um Daten in das Fabric Lakehouse zu integrieren.
Lakehouse-SQL-Analyseendpunkt
Wenn Sie ein Seehaus erstellen, generiert Fabric automatisch einen SQL-Analyseendpunkt. Dieser Endpunkt ermöglicht Folgendes:
- Abfragedeltatabellen mit T-SQL – Verwenden Sie vertraute SQL-Syntax, ohne ein separates Warehouse einzurichten.
- Verbinden Sie Power BI direkt – Ein Standardsemantikmodell ist enthalten, sodass Sie Berichte ohne zusätzliche Konfiguration erstellen können.
- Schreibgeschützten Zugriff freigeben – Analysten und Berichts-Generatoren können die Daten abfragen, ohne dass sich dies auf Spark-Workloads auswirkt.
Der SQL-Analyseendpunkt ist schreibgeschützt und unterstützt nicht die vollständige T-SQL-Oberfläche eines Data Warehouse. Verwenden Sie sie zum Durchsuchen, Melden und Ad-hoc-Abfragen.
Anmerkung
Im SQL-Analyseendpunkt werden nur Delta-Tabellen angezeigt. Parquet, CSV und andere Formate können nicht über diesen Endpunkt abgefragt werden. Wenn Die Tabelle nicht angezeigt wird, konvertieren Sie sie in das Delta-Format.
Automatische Tabellenermittlung und -registrierung
Ein Lakehouse organisiert Daten in zwei Ordner auf oberster Ebene: Tabellen für verwaltete Delta-Tabellen und Dateien für unstrukturierte oder Nicht-Delta-Daten. Wenn Sie eine Datei im Ordner Tabellen platzieren, wird Fabric automatisch:
- Überprüft die Datei anhand der unterstützten Formate (derzeit nur Delta-Tabellen).
- Extrahiert Metadaten – Spaltennamen, Datentypen, Komprimierung und Partitionierung.
- Registriert die Tabelle im Metastore, damit Sie sie sofort mit Spark SQL oder T-SQL abfragen können.
Diese verwaltete Umwandlung von Dateien in Tabellen bedeutet, dass Sie keine CREATE TABLE-Anweisungen manuell für die Daten schreiben müssen, die Sie im verwalteten Bereich ablegen.
Multitasking mit Lakehouse
Das Lakehouse verwendet ein Browser-Tab-Design, mit dem Sie mehrere Elemente öffnen und zwischen ihnen wechseln können, ohne Ihren Platz zu verlieren.
Laufende Vorgänge beibehalten: Daten werden weiterhin geladen und hochgeladen, wenn Sie zu einer anderen Tab wechseln.
Behalten Sie Ihren Kontext bei: Ausgewählte Tabellen, Dateien und Objekte bleiben geöffnet, wenn Sie zwischen Registerkarten navigieren.
Nicht blockierende Listenaktualisierung: Die Dateien- und Tabellenliste wird im Hintergrund aktualisiert, ohne Ihre Arbeit zu blockieren.
Bereichsbezogene Benachrichtigungen: Toast-Benachrichtigungen geben an, aus welchem Lakehouse sie stammen, damit Sie Updates über Registerkarten hinweg nachverfolgen können.
Barrierefreies Seehausdesign
Das Seehaus unterstützt Hilfstechnologien und barrierefreie Interaktionsmuster:
- Kompatibilität mit Bildschirmleseprogrammen: Funktioniert mit beliebten Bildschirmleseprogrammen für die Navigation und Interaktion.
- Alternativer Text für Bilder: Alle Bilder enthalten beschreibenden Alternativtext.
- Beschriftete Formularfelder: Für alle Formularfelder sind Bezeichnungen für Sprachausgabe- und Tastaturbenutzer zugeordnet.
- Textumbruch: Reaktionsfähiges Layout, das sich an verschiedene Bildschirmgrößen und Ausrichtungen anpasst.
- Tastaturnavigation: Vollständige Tastaturunterstützung für die Navigation im Seehaus ohne Maus.