Condividi tramite


Esercitazione Lakehouse: come inserire i dati nel lakehouse

In questa esercitazione si inseriscono altre tabelle dimensionali e dei fatti da Wide World Importers (WWI) nel lakehouse. Le pipeline consentono di inserire dati su larga scala con l'opzione per pianificare i flussi di lavoro dei dati.

Prerequisiti

Inserire i dati

In questa sezione si usa l'attività Copia dati della pipeline di Data Factory per inserire dati di esempio da un account di archiviazione di Azure alla sezione File della lakehouse creata nell'esercitazione precedente.

  1. Nell'area di lavoro creata nell'esercitazione precedente selezionare Nuovo elemento.

  2. Cercare Pipeline nella barra di ricerca e selezionare il riquadro Pipeline .

  3. Nella finestra di dialogo Nuova pipeline, specificare il nome IngestDataFromSourceToLakehouse e selezionare Crea.

  4. Nella scheda Home della nuova pipeline selezionare Attività pipeline>Copia dati.

    Screenshot che mostra dove selezionare l'attività della pipeline e la copia dei dati.

  5. Selezionare la nuova attività Copia dati dall'area di disegno. Le proprietà dell'attività vengono visualizzate in un riquadro sotto l'area di disegno, organizzate tra le schede, tra cui Generale, Origine, Destinazione, Mapping e Impostazioni. Potrebbe essere necessario espandere il riquadro verso l'alto trascinando il bordo superiore.

  6. Nella scheda Generale immettere Copia dati in Lakehouse nel campo Nome . Lasciare gli altri campi con i valori predefiniti.

    Screenshot che mostra dove aggiungere il nome dell'attività di copia nella scheda Generale.

  7. Nella scheda Origine selezionare l'elenco a discesa Connessione e quindi selezionare Sfoglia tutto.

  8. Nella pagina Scegliere un'origine dati per iniziare, cerca e seleziona i BLOB Azure.

  9. Inserisci i seguenti dettagli nella pagina Connetti origine dati. Selezionare quindi Connetti per creare la connessione all'origine dati. Per questa esercitazione, tutti i dati di esempio sono disponibili in un contenitore pubblico di archiviazione BLOB di Azure. Ci si connette a questo contenitore per copiare i dati da esso.

    Proprietà valore
    Nome o URL dell'account https://fabrictutorialdata.blob.core.windows.net/sampledata/
    Connessione Creare una nuova connessione
    Nome connessione wwisampledata
    Tipo di autenticazione Anonimo

    Screenshot che mostra dove selezionare la connessione all'archiviazione BLOB.

  10. Nella scheda Origine la connessione appena creata è selezionata per impostazione predefinita. Specificare le proprietà seguenti prima di passare alle impostazioni di destinazione.

    Proprietà valore
    Connessione wwisampledata
    Tipo di percorso del file Percorso del file
    Percorso del file Nome contenitore (prima casella di testo): sampledata
    La nome della directory (secondo campo di testo): WideWorldImportersDW/parquet
    Ricorsivamente Verificato
    Formato del file Binary

    Screenshot che visualizza le impostazioni di connessione di Blob Storage.

  11. Nella scheda Destinazione specificare le proprietà seguenti:

    Proprietà valore
    Connessione wwilakehouse (scegli la tua casa del lago se la chiami in modo diverso)
    Cartella radice File
    Percorso del file Nome directory (prima casella di testo): wwi-raw-data
    Formato del file Binary

    Screenshot della scheda di destinazione, che mostra dove immettere dettagli specifici.

  12. L'attività di copia dei dati è stata configurata. Selezionare l'icona Salva sulla barra multifunzione superiore (sotto Home) per salvare le modifiche e selezionare Esegui per eseguire la pipeline e la relativa attività. È anche possibile pianificare le pipeline per aggiornare i dati a intervalli definiti per soddisfare i requisiti aziendali. Per questa esercitazione, la pipeline viene eseguita una sola volta selezionando Esegui.

  13. Questa azione attiva la copia dei dati dall'origine dati sottostante al lakehouse specificato e potrebbe impiegare fino a un minuto per completare. È possibile monitorare l'esecuzione della pipeline e la relativa attività nella scheda Output. Lo stato dell'attività cambia da In attesa>in corso>Riuscito.

    Screenshot che mostra dove è possibile selezionare Salva ed eseguire la pipeline.

    Suggerimento

    Selezionare Visualizza dettagli dell'esecuzione per vedere maggiori informazioni sull'esecuzione.

  14. Dopo il completamento con successo dell'attività di copia, aprire il lakehouse (wwilakehouse) per visualizzare i dati. Aggiornare la sezione File per visualizzare i dati inseriti. Nella sezione file viene visualizzata una nuova cartella wwi-raw-data e i dati delle tabelle BLOB di Azure vengono copiati.

    Screenshot che mostra i dati BLOB copiati nel lakehouse di destinazione.

Per caricare dati incrementali in un lakehouse, vedere Caricare dati in modo incrementale da un data warehouse a una lakehouse.

Passaggio successivo