Bemærk
Adgang til denne side kræver godkendelse. Du kan prøve at logge på eller ændre mapper.
Adgang til denne side kræver godkendelse. Du kan prøve at ændre mapper.
I dette selvstudium indfødning du mere dimensionelle og fakta tabeller fra Wide World Importers (WWI) i lakehouse. Pipelines gør det muligt at indlæse data i stor skala med mulighed for at planlægge dataarbejdsgange.
Forudsætninger
- Hvis du ikke har et lakehouse, skal du oprette et lakehouse.
Indtag data
I dette afsnit bruger du aktiviteten Kopier data fra Data Factory-pipelinen til at indlæse prøvedata fra en Azure-lagringskonto til Filer-sektionen i det lakehouse, du oprettede i den forrige tutorial.
I det arbejdsområde, du oprettede i den forrige tutorial, vælger du Nyt element.
Søg efter Pipeline i søgefeltet og vælg Pipeline-flisen.
I dialogboksen Ny pipeline skal du angive navnet som IngestDataFromSourceToLakehouse og vælge Opret.
Fra din nye pipelines Home-fane vælger du Pipeline-aktivitet>Kopier data.
Vælg den nye Kopier dataaktivitet fra lærredet. Aktivitetsegenskaber vises i et panel under lærredet, organiseret på faner som Generel, Kilde, Destination, Kortlægning og Indstillinger. Du skal måske udvide ruden opad ved at trække den øverste kant.
På fanen Generel skal du indtaste Data Copy to Lakehouse i Navn-feltet . Lad de andre felter have deres standardværdier.
På fanen Kilde skal du vælge Forbindelsesdropdown , og derefter vælge Gennemse alle.
På siden Vælg en datakilde for at komme i gang , søg efter og vælg Azure-blobs.
Indtast følgende detaljer på siden Connect datakilde . Vælg derefter Connect for at oprette forbindelsen til datakilden. I dette selvstudium er alle eksempeldata tilgængelige i en offentlig objektbeholder i Azure Blob Storage. Du opretter forbindelse til denne objektbeholder for at kopiere data fra den.
Egenskab Værdi Kontonavn eller webadresse https://fabrictutorialdata.blob.core.windows.net/sampledata/Connection Opret ny forbindelse Forbindelsesnavn wwisampledata Godkendelsestype Anonym På fanen Kilde vælges den nyoprettede forbindelse som standard. Angiv følgende egenskaber, før du flytter til destinationsindstillingerne.
Egenskab Værdi Connection wwisampledata Filstitype Filsti Filsti Containernavn (første tekstfelt): sampledata
Mappenavn (anden tekstboks): WideWorldImportersDW/parketRekursivt Kontrolleret Filformat Binary På fanen Destination angiv følgende egenskaber:
Egenskab Værdi Connection wwilakehouse (vælg dit søhus, hvis du navngav det anderledes) Rodmappen Files Filsti Mappenavn (første tekstfelt): wwi-raw-data Filformat Binary Du har konfigureret aktiviteten Kopier data. Vælg ikonet Gem på det øverste bånd (under Hjem) for at gemme dine ændringer, og vælg Kør for at udføre din pipeline og dens aktivitet. Du kan også planlægge pipelines til at opdatere data med definerede intervaller for at opfylde dine forretningskrav. I dette selvstudium kører vi kun pipelinen én gang ved at vælge Kør.
Denne handling udløser datakopiering fra den underliggende datakilde til det angivne søhus og kan tage op til et minut at fuldføre. Du kan overvåge udførelsen af pipelinen og dens aktivitet under fanen Output. Aktivitetsstatus ændres fraIgangværende>>Fuldført.
Tips
Vælg Vis løbedetaljer for at se mere information om løbet.
Når kopieringsaktiviteten er vellykket, skal du åbne dit søhus (wwilakehouse) for at se dataene. Opdater sektionen Filer for at se de indtagne data. Der vises en ny mappe wwi-raw-data i filsektionen, og data fra Azure Blob-tabeller kopieres dertil.
For at indlæse inkrementelle data i et lakehouse, se Incrementally load data from a data warehouse to a lakehouse.