Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Die Spiegelung in Fabric ist eine kostengünstige und latenzarme Lösung, um Daten aus verschiedenen Systemen in einer einzigen Analyseplattform zusammenzubringen. Sie können Ihre vorhandene Datenmenge kontinuierlich direkt aus einer Vielzahl von Azure-Datenbanken und externen Datenquellen in Fabrics OneLake replizieren.
Mit den aktuellsten Daten in einem abfragefähigen Format in OneLake können Sie jetzt alle verschiedenen Dienste in Fabric nutzen, wie zum Beispiel Analysen mit Spark ausführen, Notebook-Skripte ausführen, Datenengineering, Power BI-Berichte zur Visualisierung nutzen und vieles mehr.
Die Spiegelung in Fabric ermöglicht es Benutzern, ein hoch integriertes, durchgängiges und benutzerfreundliches Produkt zu nutzen, das dafür konzipiert ist, Ihre Analyseanforderungen zu vereinfachen. Entwickelt für Offenheit und Zusammenarbeit zwischen Microsoft und Technologielösungen, die das Open-Source-Delta Lake-Tabellenformat lesen können, ist Mirroring eine kostengünstige und latenzarme schlüsselfertige Lösung, mit der Sie ein Replikat Ihrer Daten in OneLake erstellen können, das für alle Ihre analytischen Anforderungen verwendet werden kann.
Die Delta-Tabellen können dann überall in Fabric verwendet werden, sodass Benutzer ihren Einstieg in Fabric beschleunigen können.
Die Spiegelung wird durch Erstellen einer sicheren Verbindung mit Ihrer betrieblichen Datenquelle aktiviert. Sie wählen aus, ob eine gesamte Datenbank oder einzelne Tabellen repliziert werden sollen und die Datenbankspiegelung Ihre Daten automatisch synchronisiert. Einmal eingerichtet, werden Daten kontinuierlich in OneLake für analytische Zwecke repliziert.
Gründe für die Verwendung von Spiegelung in Fabric
Heute verfügen viele Organisationen über unternehmenskritische betriebskritische oder analytische Daten, die in Silos sitzen.
Für den Heutigen Zugriff und die Arbeit mit diesen Daten sind komplexe ETL-Pipelines (Extract Transform Load), Geschäftsprozesse und Entscheidungssilos erforderlich, wodurch Folgendes entsteht:
- Begrenzter und eingeschränkter Zugriff auf wichtige, sich ständig ändernde Daten
- Reibung zwischen Menschen, Prozessen und Technologien
- Lange Wartezeiten beim Erstellen von Pipelines und Prozessen zu kritisch wichtigen Daten.
- Keine Freiheit, die Tools zu verwenden, die Sie benötigen, um Einblicke bequem zu analysieren und freizugeben
- Fehlen einer geeigneten Grundlage für Menschen, um Daten zu teilen und gemeinsam daran zu arbeiten.
- Keine gängigen, offenen Datenformate für alle analytischen Szenarien – BI, AI, Integration, Engineering und sogar Apps
Die Spiegelung in Fabric bietet eine einfache Möglichkeit, um den Mehrwert von Erkenntnissen und Entscheidungen schneller zu realisieren und Datensilos zwischen technologischen Lösungen zu beseitigen.
- Nahezu echtzeitbasierte Replikation von Daten und Metadaten in einen SaaS-Datensee mit integrierter Analyse für BI und KI
Die Microsoft Fabric-Plattform basiert auf einer Grundlage von Software as a Service (SaaS), die Einfachheit und Integration auf eine ganz neue Ebene erfordert. Weitere Informationen zu Microsoft Fabric finden Sie unter Was ist Microsoft Fabric?
Im Folgenden sind die Kernprinzipien von Mirroring aufgeführt.
Die Aktivierung von Spiegelung in Fabric ist einfach und intuitiv, ohne dass komplexe ETL-Pipelines erstellt werden müssen, andere Computeressourcen zugewiesen und Datenbewegungen verwaltet werden müssen.
Die Spiegelung in Fabric ist ein vollständig verwalteter Dienst, daher müssen Sie sich keine Gedanken über das Hosting, die Verwaltung oder die Replikation der gespiegelten Verbindung machen.
Spiegeln von Objekten
Die Spiegelung erstellt diese Elemente in Ihrem Fabric-Arbeitsbereich:
- Die Spiegelung steuert die Replikation von Daten und Metadaten in OneLake und die Konvertierung in Parquet in einem analysefähigen Format. Dies ermöglicht nachgeschaltete Szenarien wie Data Engineering, Data Science und mehr.
- Ein SQL-Analyseendpunkt
Zusätzlich zum SQL-Abfrage-Editor gibt es ein breites Ökosystem von Tools, einschließlich SQL Server Management Studio (SSMS),der mssql-Erweiterung mit Visual Studio Code und sogar GitHub Copilot.
Die Freigabe ermöglicht die erleichterte Zugriffssteuerung und -verwaltung, um sicherzustellen, dass Sie den Zugriff auf vertrauliche Informationen steuern können. Das Teilen ermöglicht auch eine sichere und demokratische Entscheidungsfindung in Ihrer gesamten Organisation.
Spiegelungstypen
Fabric bietet drei verschiedene Ansätze, um Daten durch Spiegelung in OneLake zu bringen.
- Datenbankspiegelung – Datenbankspiegelung in Microsoft Fabric ermöglicht die Replikation ganzer Datenbanken und Tabellen, sodass Sie Daten aus verschiedenen Systemen in einer einzigen Analyseplattform zusammenführen können.
- Metadatenspiegelung – Die Metadatenspiegelung in Fabric synchronisiert Metadaten (z. B. Katalognamen, Schemas und Tabellen), anstatt die Daten physisch zu verschieben. Dieser Ansatz nutzt Tastenkombinationen, um sicherzustellen, dass die Daten in ihrer Quelle verbleiben und gleichzeitig in Fabric leicht zugänglich sind.
- Open Mirroring – Open Mirroring in Fabric wurde entwickelt, um die Spiegelung basierend auf dem offenen Delta Lake-Tabellenformat zu erweitern. Mit dieser Funktion können Entwickler die Änderungsdaten ihrer Anwendung direkt in ein gespiegeltes Datenbankelement in Microsoft Fabric schreiben, basierend auf dem offenen Spiegelungsansatz und öffentlichen APIs.
Derzeit sind die folgenden externen Datenbanken verfügbar:
Nahezu Echtzeit-Replikation
Nahezu Echtzeit kann von einer Vielzahl von Faktoren abhängen, einschließlich:
- Standort/Region der Quelle
- Standort/Region des Ziels
- Umfang der Änderungen
- Häufigkeit der Änderungen
- Netzwerkbandbreite und Latenz von der Quelle
- Rechenressourcen, die dem vor Ort installierten Datengateway zugeordnet sind
Wie funktioniert die Datenbankspiegelung?
Delta-Dateien kommen inkrementell aus der Datenquelle in Fabric ein. Die Methode zum Identifizieren der inkrementellen geänderten Daten variiert in jeder Datenquelle. In SQL Server 2025 überprüft das SQL-Datenbankmodul beispielsweise das Transaktionsprotokoll der Quelldatenbank mit hoher Häufigkeit. SQL Server veröffentlicht Änderungen für jede Tabelle in entsprechenden Dateien in der Fabric-Zielzone.
Innerhalb von Fabric läuft immer eine Replikator-Engine, die in hoher Frequenz nach neu veröffentlichten Dateien sucht. Fabric integriert sofort eingehende Änderungen in der Zieldeltatabelle. Änderungen können so schnell wie alle 15 Sekunden veröffentlicht werden.
Backofflogik zum Erkennen geringer Aktivitäten vermeidet übermäßigen Aufwand für Datenquellenmodule außerhalb von Fabric und verringert die Latenz, indem sie auf die Häufigkeit eingehender Datenänderungen reagieren.
Wie funktioniert die Metadatenspiegelung?
Die Spiegelung ermöglicht nicht nur die Datenreplikation, sondern kann auch durch Verknüpfungen oder Metadatenspiegelung und nicht durch vollständige Datenreplikation erreicht werden, sodass Daten verfügbar sind, ohne sie physisch zu verschieben oder zu duplizieren. Die Spiegelung in diesem Kontext bezieht sich auf das Replizieren nur von Metadaten wie Katalognamen, Schemas und Tabellen und nicht auf die tatsächlichen Daten selbst. Mit diesem Ansatz kann Fabric Daten aus verschiedenen Quellen zugänglich machen, ohne sie zu duplizieren, die Datenverwaltung zu vereinfachen und die Speicheranforderungen zu minimieren.
Wenn Sie beispielsweise auf daten zugreifen, die im Unity-Katalog registriert sind, spiegelt Fabric nur die Katalogstruktur von Azure Databricks wider, sodass auf die zugrunde liegenden Daten über Verknüpfungen zugegriffen werden kann. Diese Methode stellt sicher, dass alle Änderungen an den Quelldaten sofort in Fabric widerspiegelt werden, ohne dass eine Datenbewegung erforderlich ist. Dadurch wird die Echtzeitsynchronisierung beibehalten und die Effizienz beim Zugriff auf aktuelle Informationen verbessert.
Wie funktioniert die offene Spiegelung?
Zusätzlich zur Spiegelung, indem Sie eine sichere Verbindung mit Ihrer Datenquelle herstellen, können Sie auch einen vorhandenen Datenanbieter auswählen oder Ihre eigene Anwendung schreiben, um Daten in die gespiegelte Datenbank abzulegen. Nachdem Sie eine geöffnete gespiegelte Datenbank über die öffentliche API oder über das Fabric-Portal erstellt haben, können Sie eine Zielzonen-URL in OneLake abrufen, in der Sie Daten pro offener Spiegelungsspezifikation landen können.
Sobald sich Daten in der Zielzone mit dem richtigen Format befinden, wird die Replikation gestartet und verwaltet die Komplexität der Zusammenführung der Änderungen mit Updates, Einfügen und Löschen, um in Delta-Tabellen widergespiegelt zu werden. Diese Methode stellt sicher, dass alle in die Landezone geschriebenen Daten sofort aktualisiert werden und die Daten in Fabric auf dem neuesten Stand bleiben.
Freigabe
Teilen ermöglicht eine einfachere Zugriffssteuerung und -verwaltung, während Sicherheitskontrollen wie Sicherheit auf Zeilenebene (RLS) und Sicherheit auf Objektebene (OLS) und mehr sicherstellen, dass Sie den Zugriff auf vertrauliche Informationen steuern können. Das Teilen ermöglicht auch sichere und demokratische Entscheidungsfindung in Ihrer gesamten Organisation.
Durch die Freigabe gewähren Benutzer anderen Benutzern oder einer Gruppe von Benutzern Zugriff auf eine gespiegelte Datenbank, ohne zugriff auf den Arbeitsbereich und die restlichen Elemente zu gewähren. Wenn jemand eine gespiegelte Datenbank teilt, gewähren sie auch Zugriff auf den SQL-Analyseendpunkt.
Weitere Informationen finden Sie unter Freigeben Ihrer gespiegelten Datenbank und Verwalten von Berechtigungen.
Datenbankübergreifende Abfragen
Mit den Daten aus Der gespiegelten Datenbank, die in OneLake gespeichert sind, können Sie Datenbankübergreifende Abfragen schreiben, Daten aus gespiegelten Datenbanken, Lagerhäusern und den SQL-Analyseendpunkten von Lakehouses in einer einzigen T-SQL-Abfrage verknüpfen. Weitere Informationen finden Sie unter Schreiben einer datenbankübergreifenden Abfrage.
Sie können z. B. auf die Tabelle aus gespiegelten Datenbanken und Datenlagerhäusern unter Verwendung einer dreiteiligen Benennung verweisen. Verwenden Sie im folgenden Beispiel den dreiteiligen Namen, um auf ContosoSalesTable im Lager ContosoWarehouse zu verweisen. Aus anderen Datenbanken oder Datenlagern ist der erste Teil der dreiteiligen SQL-Standardbenennungskonvention der Name der gespiegelten Datenbank.
SELECT *
FROM ContosoWarehouse.dbo.ContosoSalesTable AS Contoso
INNER JOIN Affiliation
ON Affiliation.AffiliationId = Contoso.RecordTypeID;
Kosten für die Spiegelung
Für die Datenbankspiegelung und die offene Spiegelung sind der Fabric-Compute- und OneLake-Speicher bis zu einem kapazitätsbasierten Grenzwert frei.
- Speicher für Repliken ist bis zu einem festgelegten Grenzwert, der sich nach der Kapazitätsgröße richtet, kostenlos. Mirroring bietet einen kostenlosen Terabyte Spiegelungsspeicher für jede von Ihnen erworbene Kapazitätseinheit (CU). Wenn Sie z. B. eine F64-Kapazität erwerben, erhalten Sie 64 kostenlose Terabyte Speicherplatz, der ausschließlich für die Spiegelung verwendet wird. OneLake-Speicher wird in Rechnung gestellt, wenn die kostenfreie Spiegelungsspeichergrenze überschritten wird oder wenn die Kapazität angehalten wird. Weitere Informationen finden Sie unter Microsoft Fabric-Preise.
- Die Background Fabric-Compute, die zum Replizieren Ihrer Daten in Fabric OneLake verwendet wird, ist kostenlos und verbraucht keine Kapazität. Anfragen direkt an OneLake für gespiegelte Daten verbrauchen Kapazität wie die normale OneLake-Rechenleistung. Die Abfrageberechnung von Daten mit SQL, Power BI oder Spark wird zu regulären Preisen berechnet.
- Eine betriebsbereite Fabric-Kapazität ist nur für die Ersteinrichtung von Spiegelung erforderlich.
Data Engineering mit Ihren gespiegelten Daten aus der Datenbank
Microsoft Fabric bietet verschiedene Datentechnikfunktionen, um sicherzustellen, dass Ihre Daten leicht zugänglich, gut organisiert und qualitativ hochwertig sind. Aus Fabric Data Engineering können Sie:
- Erstellen und verwalten Sie Ihre Daten mit Spark in einer Lakehouse-Architektur
- Entwerfen Sie Pipelines, um Daten in Ihr Lakehouse zu kopieren.
- Verwenden von Spark-Auftragsdefinitionen zum Senden eines Batch-/Streamingauftrags an Spark-Cluster
- Verwenden von Notizbüchern zum Schreiben von Code für Die Erfassung, Vorbereitung und Transformation von Daten
Data Science mit gespiegelten Datenbankdaten
Microsoft Fabric bietet Fabric Data Science an, um Benutzern die Möglichkeit zu geben, End-to-End Data Science-Workflows für den Zweck der Datenerweiterung und Geschäftseinblicke abzuschließen. Sie können eine breite Palette von Aktivitäten im gesamten Data Science-Prozess durchführen, von der Datenerkundung, Vorbereitung und Reinigung bis hin zu Experimentierung, Modellierung, Modellbewertung und Bereitstellung von predictive Insights für BI-Berichte.
Microsoft Fabric-Benutzer können auf Data Science-Workloads zugreifen. Von dort aus können sie verschiedene relevante Ressourcen entdecken und darauf zugreifen. Sie können z. B. Machine Learning Experimente, Modelle und Notizbücher erstellen. Sie können auch vorhandene Notizbücher auf der Data Science-Startseite importieren.
Direct Lake mit gespiegelten Datenbankdaten
Der Direct Lake-Modus kann mit gespiegelten Datenbanken in Microsoft Fabric verwendet werden, um hochleistungsfähige Abfragen über gespiegelte Daten zu ermöglichen, ohne dass Datenverschiebungen oder Duplizierung erforderlich sind. Wenn eine gespiegelte Datenbank erstellt wird, werden ihre Daten im Delta Lake-Format in OneLake gespeichert. Mit diesem nativen Format können Power BI und andere Analysetools über den Direct Lake-Modus eine Verbindung herstellen, die nahezu echtzeitbasierte Einblicke bietet, indem sie direkt auf die zugrunde liegenden Dateien zugreifen. Diese Integration kombiniert die Einfachheit der Spiegelung mit der Geschwindigkeit und Skalierbarkeit von Direct Lake, wodurch schnelle, aktuelle Berichte zu betrieblichen Daten ermöglicht werden.
Aufbewahrung für gespiegelte Daten
Mirroring in Fabric repliziert kontinuierlich Ihren bestehenden Datenbestand in OneLake im Delta-Lake-Tabellenformat. Um die gespiegelten Daten effizient zu speichern und immer für Analysen bereit zu halten, führt die Spiegelung automatisch Vakuum aus, um alte Dateien zu entfernen, auf die nicht mehr durch ein Delta-Protokoll verwiesen wird.
Sie können die Aufbewahrungseinstellung entsprechend Ihren Anforderungen anpassen. Sie können z. B. einen kürzeren Aufbewahrungszeitraum auswählen, um den Spiegelungsspeicherverbrauch zu reduzieren oder den Aufbewahrungszeitraum zu verlängern, um die Zeitreisefunktionen von Delta für Analysen zu nutzen.
Für gespiegelte Datenbanken, die nach Mitte Juni 2025 aus dem Fabric-Portal erstellt wurden, beträgt die Standardaufbewahrungsfrist einen Tag. Bei alten gespiegelten Datenbanken ist die Standardeinstellung sieben Tage. Um die Aufbewahrungseinstellung zu überprüfen oder zu aktualisieren, navigieren Sie im Fabric-Portal zur gespiegelten Datenbank ->Einstellungen ->Wartung und geben Sie den Aufbewahrungsschwellenwert an. Sie können sie auch über öffentliche API konfigurieren, indem Sie die retentionInDays Eigenschaft angeben.
SQL-Datenbank in Fabric
Sie können auch direkt eine SQL-Datenbank in Microsoft Fabric im Fabric-Portal erstellen und verwalten. Basierend auf der Azure SQL-Datenbank wird die SQL-Datenbank in Fabric automatisch für Analysezwecke gespiegelt und ermöglicht es Ihnen, Ihre betriebsbereite Datenbank in Fabric auf einfache Weise zu erstellen. Die SQL-Datenbank ist das Zuhause in Fabric für OLTP-Workloads und kann in die Quellcodeverwaltung von Fabric integriert werden.