Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Il mirroring in Fabric è una soluzione a basso costo e a bassa latenza per riunire i dati di vari sistemi in una singola piattaforma di analisi. È possibile replicare continuamente il patrimonio di dati esistente direttamente in OneLake di Fabric da un'ampia gamma di database di Azure e origini dati esterne.
Con i dati più up-to-date in un formato querybile in OneLake, è ora possibile usare tutti i diversi servizi in Fabric, ad esempio l'esecuzione di analisi con Spark, l'esecuzione di notebook, la progettazione dei dati, la visualizzazione tramite report di Power BI e altro ancora.
Il mirroring in Fabric consente agli utenti di usufruire di un prodotto end-to-end altamente integrato e facile da usare progettato per semplificare le esigenze di analisi. Progettato per l'apertura e la collaborazione tra Microsoft e soluzioni tecnologiche in grado di leggere il formato di tabella Delta Lake open source, il mirroring è una soluzione chiavi in mano a basso costo e a bassa latenza che consente di creare una replica dei dati in OneLake che può essere usata per tutte le esigenze analitiche.
Le tabelle Delta possono quindi essere usate ovunque in Fabric, consentendo agli utenti di accelerare il loro percorso verso Fabric.
Il mirroring è abilitato creando una connessione sicura all'origine dati operativa. Si sceglie se replicare un intero database o singole tabelle e il mirroring manterrà automaticamente sincronizzati i dati. Dopo la configurazione, i dati verranno replicati in modo continuo in OneLake per l'utilizzo di analisi.
Perché usare il mirroring in Fabric?
Oggi molte organizzazioni hanno dati operativi o analitici cruciali seduti in silo.
L'accesso e l'uso di questi dati richiedono attualmente pipeline ETL complesse (estrazione, trasformazione e caricamento), processi aziendali e silo decisionali, creando:
- Accesso limitato e limitato a dati importanti, in continua evoluzione
- Attrito tra persone, processi e tecnologia
- Tempi di attesa lunghi per creare pipeline e processi per dati di importanza critica
- Nessuna libertà di usare gli strumenti necessari per analizzare e condividere informazioni dettagliate comodamente
- Mancanza di una base adeguata per le persone che condividono e collaborano sui dati
- Nessun formato di dati comune e aperto per tutti gli scenari analitici- BI, intelligenza artificiale, integrazione, progettazione e persino app
Il mirroring in Fabric offre un'esperienza semplice per velocizzare il tempo per ottenere valore da intuizioni e decisioni, ed eliminare i silo di dati tra le soluzioni tecnologiche.
- Replica quasi in tempo reale di dati e metadati in un data lake SaaS, con analisi predefinite per BI e intelligenza artificiale
La piattaforma Microsoft Fabric si basa su una base di Software as a Service (SaaS), che porta semplicità e integrazione a un livello completamente nuovo. Per altre informazioni su Microsoft Fabric, vedere Che cos'è Microsoft Fabric?
Di seguito sono riportati i principi fondamentali del mirroring:
L'abilitazione del mirroring in Fabric è semplice e intuitiva, senza dover creare pipeline ETL complesse, allocare altre risorse di calcolo e gestire lo spostamento dei dati.
Il mirroring in Fabric è un servizio completamente gestito, pertanto non è necessario preoccuparsi di ospitare, gestire o gestire la replica della connessione con mirroring.
Riflettere gli oggetti
Il mirroring crea questi elementi nell'area di lavoro Fabric:
- Il mirroring gestisce la replica di dati e metadati in OneLake e la conversione in Parquet, in un formato pronto per l'analisi. Ciò consente scenari downstream come ingegneria dei dati, data science e altro ancora.
- Un endpoint di analisi SQL
Oltre all'editor di query SQL, è disponibile un ampio ecosistema di strumenti, tra cui SQL Server Management Studio (SSMS),l'estensione mssql con Visual Studio Code e anche GitHub Copilot.
La condivisione consente la facilità di controllo e gestione degli accessi, per assicurarsi di poter controllare l'accesso alle informazioni riservate. La condivisione consente anche di prendere decisioni sicure e democratizzate nell'organizzazione.
Tipi di duplicazione
Fabric offre tre diversi approcci per l'inserimento dei dati in OneLake tramite il mirroring.
- Mirroring del database: il mirroring del database in Microsoft Fabric consente la replica di interi database e tabelle, consentendo di riunire i dati da vari sistemi in una singola piattaforma di analisi.
- Mirroring dei metadati – Il mirroring dei metadati in Fabric sincronizza i metadati, ad esempio nomi di catalogo, schemi e tabelle, anziché spostare fisicamente i dati. Questo approccio sfrutta i tasti di scelta rapida, assicurando che i dati rimangano nell'origine pur essendo facilmente accessibili all'interno di Fabric.
- Mirroring aperto – Il mirroring aperto in Fabric è progettato per estendere il mirroring nel formato di tabella Delta Lake aperto. Questa funzionalità consente a qualsiasi sviluppatore di scrivere i dati delle modifiche dell'applicazione direttamente in un elemento di database con mirroring in Microsoft Fabric, in base all'approccio di mirroring aperto e alle API pubbliche.
Attualmente sono disponibili i database esterni seguenti:
Replica quasi in tempo reale
Il tempo quasi reale può dipendere da diversi fattori, tra cui:
- Località/area di origine
- Località/area di destinazione
- Volume di modifiche
- Frequenza delle modifiche
- Larghezza di banda e latenza di rete dall'origine
- Risorse di calcolo allocate al gateway dati locale
Come funziona il mirroring del database?
I file delta arrivano in modo incrementale in Fabric dall'origine dati. Il metodo di identificazione dei dati modificati in modo incrementale varia in ogni origine dati. In SQL Server 2025, ad esempio, il motore di database SQL analizza il log delle transazioni del database di origine con una frequenza elevata. SQL Server pubblica le modifiche per ogni tabella nei file corrispondenti nella zona di destinazione Fabric.
All'interno di Fabric, un motore di replicator è sempre in esecuzione e cerca i file appena pubblicati ad alta frequenza. Fabric unisce immediatamente le modifiche in ingresso nella tabella delta di destinazione. Le modifiche possono essere pubblicate rapidamente ogni 15 secondi.
La logica di backoff per rilevare un'attività bassa evita un sovraccarico eccessivo nei motori di origine dati all'esterno di Fabric e riduce la latenza rispondendo alla frequenza delle modifiche ai dati in ingresso.
Come funziona il mirroring dei metadati?
Il mirroring non solo abilita la replica dei dati, ma può essere ottenuto anche tramite collegamenti o mirroring dei metadati anziché la replica completa dei dati, consentendo la disponibilità dei dati senza spostarli fisicamente o duplicarli. Il mirroring in questo contesto si riferisce alla replica solo dei metadati, ad esempio nomi di catalogo, schemi e tabelle, anziché i dati effettivi stessi. Questo approccio consente a Fabric di rendere accessibili i dati da origini diverse senza duplicarli, semplificando la gestione dei dati e riducendo al minimo le esigenze di archiviazione.
Ad esempio, quando si accede ai dati registrati in Unity Catalog, Fabric esegue il mirroring solo della struttura del catalogo di Azure Databricks, consentendo l'accesso ai dati sottostanti tramite collegamenti. Questo metodo garantisce che le modifiche apportate ai dati di origine vengano riflesse immediatamente in Fabric senza richiedere lo spostamento dei dati, mantenendo la sincronizzazione in tempo reale e migliorando l'efficienza nell'accesso alle informazioni up-to-date.
Come funziona il mirroring aperto?
Oltre al mirroring che abilita la replica dei dati creando una connessione sicura all'origine dati, è anche possibile selezionare un provider di dati esistente o scrivere un'applicazione personalizzata per trasferire i dati nel database con mirroring. Dopo aver creato un database con mirroring aperto tramite l'API pubblica o tramite il portale di Fabric, sarà possibile ottenere un URL della zona di destinazione in OneLake, in cui è possibile trasferire i dati delle modifiche in base alla specifica del mirroring aperto.
Una volta che i dati si trovano nella zona di destinazione con il formato corretto, la replica inizierà a funzionare e gestirà la complessità dell'unione delle modifiche con gli aggiornamenti, l'inserimento e l'eliminazione da riflettere nelle tabelle delta. Questo metodo garantisce che tutti i dati scritti nella zona di atterraggio siano immediatamente aggiornati, mantenendo i dati in Fabric aggiornati.
Condivisione
La condivisione consente la facilità di controllo e gestione degli accessi, mentre i controlli di sicurezza come la sicurezza a livello di riga (RLS), la sicurezza a livello di oggetto (OLS) e altro ancora assicurano di poter controllare l'accesso alle informazioni riservate. La condivisione consente anche di prendere decisioni sicure e democratizzate nell'organizzazione.
Condividendo, gli utenti concedono ad altri utenti o a un gruppo di utenti l'accesso a un database con mirroring senza concedere l'accesso all'area di lavoro e al resto degli elementi. Quando un utente condivide un database con mirroring, concede anche l'accesso all'endpoint di analisi SQL.
Per altre informazioni, vedere Condividere il database con mirroring e gestire le autorizzazioni.
Query interdatabase
Con i dati del database con mirroring archiviati in OneLake, è possibile scrivere query tra database, unire dati da database con mirroring, warehouse e endpoint di analisi SQL di Lakehouse in una singola query T-SQL. Per altre informazioni, vedere Scrivere una query tra più database.
Ad esempio, è possibile fare riferimento alla tabella da database e warehouse con mirroring usando la denominazione in tre parti. Nell'esempio seguente usare il nome in tre parti per fare riferimento a ContosoSalesTable nel magazzino ContosoWarehouse. Da altri database o magazzini dati, la prima parte della convenzione di denominazione standard di SQL in tre parti è il nome del database specchiato.
SELECT *
FROM ContosoWarehouse.dbo.ContosoSalesTable AS Contoso
INNER JOIN Affiliation
ON Affiliation.AffiliationId = Contoso.RecordTypeID;
Costo del mirroring
Per il mirroring del database e il mirroring aperto, il calcolo della piattaforma Fabric e l'archiviazione OneLake sono gratuiti fino a un limite basato sulla capacità.
- L'archiviazione per le repliche è gratuita fino a un limite in base alla dimensione della capacità. Il mirroring offre un terabyte gratuito di archiviazione del mirroring per ogni unità di capacità (CU) acquistata. Ad esempio, se si acquista una capacità F64, si ottengono 64 terabyte gratuiti di spazio di archiviazione, usato esclusivamente per il mirroring. L'archiviazione OneLake viene fatturata se viene superato il limite di archiviazione del mirroring gratuito o quando la capacità viene sospesa. Per altre informazioni, vedere Prezzi di Microsoft Fabric.
- Il calcolo di Fabric in background usato per replicare i dati in Fabric OneLake è gratuito e non utilizza la capacità. Le richieste direttamente a OneLake per i dati specchiati consumano capacità come il normale utilizzo computazionale di OneLake. Il calcolo per l'esecuzione di query sui dati tramite SQL, Power BI o Spark viene addebitato a tariffe regolari.
- È richiesta una capienza operativa di Fabbrica solo per la configurazione iniziale del mirroring.
Ingegneria dei dati con i dati duplicati del database
Microsoft Fabric offre varie funzionalità di ingegneria dei dati per garantire che i dati siano facilmente accessibili, ben organizzati e di alta qualità. Da Fabric Data Engineering è possibile:
- La creazione e la gestione dei dati con Spark usando un lakehouse
- Progettare pipeline per copiare dati in un lakehouse
- Usare le definizioni dei processi Spark per inviare un processo batch/streaming al cluster Spark
- Usare i notebook per scrivere codice per l'inserimento, la preparazione e la trasformazione dei dati
Data Science con i dati del tuo database replicato
Microsoft Fabric offre Fabric Data Science per consentire agli utenti di completare flussi di lavoro di data science end-to-end per arricchire i dati e ottenere approfondimenti aziendali. È possibile completare un'ampia gamma di attività nell'intero processo di analisi scientifica dei dati, dall'esplorazione dei dati, dalla preparazione e dalla pulizia alla sperimentazione, alla modellazione, al punteggio del modello e alla gestione di informazioni dettagliate predittive nei report bi.
Gli utenti di Microsoft Fabric possono accedere ai carichi di lavoro di data science. Da qui possono individuare e accedere a varie risorse pertinenti. Ad esempio, possono creare esperimenti, modelli e notebook di Machine Learning. Possono anche importare i notebook esistenti sulla pagina principale di Data Science.
Direct Lake con i dati del database duplicato
La modalità Direct Lake può essere usata con database con mirroring in Microsoft Fabric per consentire l'esecuzione di query ad alte prestazioni sui dati con mirroring senza la necessità di spostamento o duplicazione dei dati. Quando viene creato un database con mirroring, i relativi dati vengono archiviati in formato Delta Lake all'interno di OneLake. Questo formato nativo consente a Power BI e ad altri strumenti di analisi di connettersi tramite la modalità Direct Lake, offrendo informazioni dettagliate quasi in tempo reale accedendo direttamente ai file sottostanti. Questa integrazione combina la semplicità del mirroring con la velocità e scalabilità di Direct Lake, consentendo una reportistica rapida e aggiornata sui dati operativi.
Conservazione dei dati speculari
Il mirroring in Fabric replica costantemente l'ambiente di dati esistente in OneLake in formato di tabella Delta Lake. Per mantenere i dati con mirroring archiviati in modo efficiente e sempre pronti per l'analisi, il processo di mirroring esegue automaticamente vacuum per rimuovere i file vecchi a cui non fa più riferimento un log Delta.
È possibile personalizzare l'impostazione di conservazione in base ai requisiti. Ad esempio, è possibile scegliere un periodo di conservazione più breve per ridurre il consumo di archiviazione del mirroring o estendere il periodo di conservazione per utilizzare le funzionalità di temporizzazione di Delta per scopi analitici.
Per i database con mirroring creati dal portale di Fabric dopo la metà di giugno 2025, la conservazione predefinita è un giorno. Per i database con mirroring precedenti, il valore predefinito è sette giorni. Per controllare o aggiornare l'impostazione di retention, nel portale Fabric, passare al tuo database con mirroring ->Impostazioni ->nella scheda Manutenzione e specificare la soglia di retention. È anche possibile configurarla tramite l'API pubblica specificando la retentionInDays proprietà .
Database SQL su Fabric
È anche possibile creare e gestire direttamente un database SQL in Microsoft Fabric all'interno del portale di Fabric. In base al database SQL di Azure, il database SQL in Fabric viene automaticamente sottoposto a mirroring a scopo di analisi e consente di creare facilmente il database operativo in Fabric. Il database SQL è la home page di Fabric per i carichi di lavoro OLTP e può essere integrato con l'integrazione del controllo del codice sorgente di Fabric.