Del via


Transformér data ved at køre en notesbog

Brug aktiviteten Notesbog til at køre notesbøger , du opretter i Microsoft Fabric, som en del af dine Data Factory-pipelines. Med notesbøger kan du køre Apache Spark-job for at hente, rydde op i eller transformere dine data som en del af dine dataarbejdsprocesser. Det er nemt at føje en notesbogsaktivitet til dine pipelines i Fabric, og denne vejledning fører dig gennem hvert trin.

Forudsætninger

For at komme i gang skal du fuldføre følgende forudsætninger:

Opret en notesbogaktivitet

  1. Opret en ny pipeline i dit arbejdsområde.

  2. Søg efter Notesbog i ruden Pipelineaktiviteter, og vælg den for at føje den til pipelinelærredet.

    Skærmbillede af brugergrænsefladen Fabric med ruden Aktiviteter og Notesbogaktivitet fremhævet.

  3. Vælg den nye notesbogaktivitet på lærredet, hvis den ikke allerede er valgt.

    Skærmbillede, der viser fanen Generelle indstillinger i notesbogaktiviteten.

    Se vejledningen til generelle indstillinger for at konfigurere fanen Generelle indstillinger.

Konfigurer indstillinger for notesbog

Vælg fanen Indstillinger.

Under Forbindelse skal du vælge autentificeringsmetoden for notebook-kørslen og angive de nødvendige legitimationsoplysninger.

Vælg en eksisterende notesbog fra notesbogsmenuen , og angiv eventuelt eventuelle parametre, der skal sendes til notesbogen.

Skærmbillede, der viser fanen Indstillinger for notesbog, der fremhæver fanen, hvor du kan vælge en notesbog, og hvor du kan tilføje parametre.

Angiv sessionsmærke

Hvis du vil minimere den tid, det tager at udføre notesbogjobbet, kan du eventuelt angive et sessionsmærke. Når du angiver sessionskoden, får Spark besked om at genbruge en eksisterende Spark-session, hvilket minimerer starttidspunktet. Alle vilkårlige strengværdier kan bruges til sessionskoden. Hvis der ikke findes en session, oprettes der en ny ved hjælp af kodeværdien.

Skærmbillede, der viser fanen Indstillinger for notesbog, der fremhæver fanen, hvor du kan tilføje sessionsmærke.

Bemærk

Hvis du vil kunne bruge sessionskoden, skal indstillingen Høj samtidighedstilstand for pipeline, der kører flere notesbøger, være slået til. Denne indstilling kan findes under tilstanden Høj samtidighed for Spark-indstillinger under indstillingerne for arbejdsområdet

Skærmbillede, der viser fanen Indstillinger for arbejdsområde, der fremhæver fanen, hvor du kan aktivere høj samtidighedstilstand for pipelines, der kører flere notesbøger.

Gem og kør eller planlæg pipelinen

Skift til fanen Hjem øverst i pipeline-editoren og vælg gem-knappen for at gemme din pipeline. Vælg Kør for at køre direkte eller Skemalæg for at planlægge løb på bestemte tidspunkter eller intervaller. For mere information om rørledningskørsler, se: planlæg rørledningskørsler.

Skærmbillede, der viser fanen Hjem i pipelineeditoren med tabulatornavnet, knapperne Gem, Kør og Planlæg fremhævet.

Efter kørsel kan du overvåge pipeline-udførelsen og se kørselshistorik fra fanen Output under lærredet.

Kendte problemer

  • WI-indstillingen i forbindelsesindstillingerne dukker ikke op i nogle tilfælde. Dette er en fejl, som der er under reparation i øjeblikket.
  • At bruge Service Principal til at køre en notesbog, der indeholder Semantic Link-kode, har funktionelle begrænsninger og understøtter kun et delmængde af semantiske link-funktioner. Se de understøttede semantiske linkfunktioner for detaljer. Hvis du vil bruge andre funktioner, anbefales det manuelt at godkende semantisk link med en tjenesteprincipal.
  • Nogle kunder ser måske ikke Workspace Identity (WI) dropdown-menuen, eller kan se den, men kan ikke oprette en forbindelse. Denne adfærd skyldes et kendt problem i en af vores underliggende platformkomponenter. Rettelsen arbejdes i øjeblikket på.