Freigeben über


Was ist ein Seehaus in Microsoft Fabric?

Ein Lakehouse in Microsoft Fabric kombiniert die Skalierbarkeit eines Data Lake mit den Abfragefunktionen eines Data Warehouse. Sie speichern strukturierte und unstrukturierte Daten an einem einzigen Ort, verwalten sie mit Delta Lake und analysieren sie mit Apache Spark und SQL – alles ohne Datenverschiebung zwischen Systemen.

Ein Seehaus gibt Ihnen:

  • Eine Datenkopie für Datenengineering und Analyse-Workloads
  • Delta Lake-Format für ACID-Transaktionen, Schemaerzwingung und Zeitreise
  • Spark und SQL-Zugriff, sodass Dateningenieure Notebooks verwenden, während Analysten T-SQL nutzen.
  • Eingebaute Integration mit Power BI, Pipelines, Datenflüssen und anderen Fabric-Elementen

Lakehouse vs. Data Warehouse

Die wichtigsten Unterschiede zwischen einem Seehaus und einem Data Warehouse in Microsoft Fabric ergeben sich aus Ihren bevorzugten Entwicklungstools, Datentypen und Arbeitsauslastungsmustern. Beide teilen dasselbe SQL-Modul und speichern Daten im Delta-Format auf OneLake, sind jedoch für verschiedene Szenarien ausgelegt:

Lakehouse Datenlager
Primäres Entwicklungstool Apache Spark (Python, Scala, SQL, R) T-SQL
Datentypen Strukturiert und unstrukturiert Strukturiert
Transaktionen mit mehreren Tabellen Nein Ja
Dateneinbindung Notizbücher, Pipelines, Datenflüsse, Kurzbefehle T-SQL (COPY INTO, INSERT, CTAS), Pipelines
Am besten geeignet für Data Engineering, Data Science, Medallion-Architekturen BI-Berichterstellung, dimensionale Modellierung, SQL-zentrierte Teams

Sie können beide im selben Arbeitsbereich verwenden – zum Beispiel durch Landung und Transformation von Daten in einem Lakehouse mit Spark und anschließend kuratierte Datensätze für ein Data Warehouse für SQL-basierte Berichte bereitstellen. Ausführliche Anleitungen finden Sie unter Wählen Sie zwischen Warehouse und Lakehouse.

Arbeiten mit Lakehouse-Daten

Sie können Daten in einem Lakehouse über mehrere Fabric-Tools laden, transformieren und abfragen:

Einen vollständigen Vergleich der Aufnahmeoptionen finden Sie unter "Optionen", um Daten in das Fabric Lakehouse zu integrieren.

Lakehouse-SQL-Analyseendpunkt

Wenn Sie ein Seehaus erstellen, generiert Fabric automatisch einen SQL-Analyseendpunkt. Dieser Endpunkt ermöglicht Folgendes:

  • Abfragedeltatabellen mit T-SQL – Verwenden Sie vertraute SQL-Syntax, ohne ein separates Warehouse einzurichten.
  • Verbinden Sie Power BI direkt – Ein Standardsemantikmodell ist enthalten, sodass Sie Berichte ohne zusätzliche Konfiguration erstellen können.
  • Schreibgeschützten Zugriff freigeben – Analysten und Berichts-Generatoren können die Daten abfragen, ohne dass sich dies auf Spark-Workloads auswirkt.

Der SQL-Analyseendpunkt ist schreibgeschützt und unterstützt nicht die vollständige T-SQL-Oberfläche eines Data Warehouse. Verwenden Sie sie zum Durchsuchen, Melden und Ad-hoc-Abfragen.

Anmerkung

Im SQL-Analyseendpunkt werden nur Delta-Tabellen angezeigt. Parquet, CSV und andere Formate können nicht über diesen Endpunkt abgefragt werden. Wenn Die Tabelle nicht angezeigt wird, konvertieren Sie sie in das Delta-Format.

Automatische Tabellenermittlung und -registrierung

Ein Lakehouse organisiert Daten in zwei Ordner auf oberster Ebene: Tabellen für verwaltete Delta-Tabellen und Dateien für unstrukturierte oder Nicht-Delta-Daten. Wenn Sie eine Datei im Ordner Tabellen platzieren, wird Fabric automatisch:

  • Überprüft die Datei anhand der unterstützten Formate (derzeit nur Delta-Tabellen).
  • Extrahiert Metadaten – Spaltennamen, Datentypen, Komprimierung und Partitionierung.
  • Registriert die Tabelle im Metastore, damit Sie sie sofort mit Spark SQL oder T-SQL abfragen können.

Diese verwaltete Umwandlung von Dateien in Tabellen bedeutet, dass Sie keine CREATE TABLE-Anweisungen manuell für die Daten schreiben müssen, die Sie im verwalteten Bereich ablegen.

Multitasking mit Lakehouse

Das Lakehouse verwendet ein Browser-Tab-Design, mit dem Sie mehrere Elemente öffnen und zwischen ihnen wechseln können, ohne Ihren Platz zu verlieren.

  • Laufende Vorgänge beibehalten: Daten werden weiterhin geladen und hochgeladen, wenn Sie zu einer anderen Tab wechseln.

  • Behalten Sie Ihren Kontext bei: Ausgewählte Tabellen, Dateien und Objekte bleiben geöffnet, wenn Sie zwischen Registerkarten navigieren.

  • Nicht blockierende Listenaktualisierung: Die Dateien- und Tabellenliste wird im Hintergrund aktualisiert, ohne Ihre Arbeit zu blockieren.

  • Bereichsbezogene Benachrichtigungen: Toast-Benachrichtigungen geben an, aus welchem Lakehouse sie stammen, damit Sie Updates über Registerkarten hinweg nachverfolgen können.

Barrierefreies Seehausdesign

Das Seehaus unterstützt Hilfstechnologien und barrierefreie Interaktionsmuster:

  • Kompatibilität mit Bildschirmleseprogrammen: Funktioniert mit beliebten Bildschirmleseprogrammen für die Navigation und Interaktion.
  • Alternativer Text für Bilder: Alle Bilder enthalten beschreibenden Alternativtext.
  • Beschriftete Formularfelder: Für alle Formularfelder sind Bezeichnungen für Sprachausgabe- und Tastaturbenutzer zugeordnet.
  • Textumbruch: Reaktionsfähiges Layout, das sich an verschiedene Bildschirmgrößen und Ausrichtungen anpasst.
  • Tastaturnavigation: Vollständige Tastaturunterstützung für die Navigation im Seehaus ohne Maus.