Condividi tramite


Output di Esplora dati di Azure da Analisi di flusso di Azure

È possibile usare Esplora dati di Azure come output per analizzare grandi volumi di dati diversi da qualsiasi origine dati, ad esempio siti Web, applicazioni e dispositivi Internet delle cose (IoT). Esplora dati di Azure è un servizio di esplorazione dati rapido e a scalabilità elevata per dati di log e di telemetria. Consente di gestire i numerosi flussi di dati generati dal software moderno, in modo da poter raccogliere, archiviare e analizzare i dati. Questi dati vengono usati per la diagnostica, il monitoraggio, la creazione di report, l'apprendimento automatico e altre funzionalità di analisi.

Esplora dati di Azure supporta diversi metodi di inserimento, inclusi i connettori a servizi comuni, ad esempio Hub eventi di Azure, l'inserimento a livello di codice tramite SDK come .NET e Python e l'accesso diretto al motore a scopo di esplorazione. Esplora dati di Azure si integra con i servizi di analisi e modellazione per l'analisi e la visualizzazione dei dati aggiuntivi.

Per altre informazioni su Esplora dati di Azure, vedere Che cos'è Esplora dati di Azure?

Per altre informazioni su come creare un cluster di Esplora dati di Azure usando il portale di Azure, vedere Avvio rapido: Creare un cluster e un database di Esplora dati di Azure.

Annotazioni

Esplora dati di Azure da Analisi di flusso di Azure supporta l'output su Esplora dati di Azure Synapse. Per scrivere nei cluster di Esplora dati di Azure Synapse, specificare l'URL del cluster nel riquadro di configurazione per l'output di Esplora dati di Azure nel processo di Analisi di flusso di Azure.

Configurazione dell'output

La tabella seguente elenca i nomi delle proprietà e le relative descrizioni per la creazione di un output di Esplora dati di Azure.

Nome della proprietà Descrzione
Alias di output Nome intuitivo utilizzato nelle query per indirizzare l'output della query a questo database.
Subscription La sottoscrizione di Azure che desideri utilizzare per il tuo cluster.
Cluster Nome univoco che identifica il tuo cluster. Il nome del dominio <region>.kusto.windows.net viene aggiunto al nome del cluster che si fornisce. Il nome può contenere solo lettere minuscole e numeri. Deve contenere da 4 a 22 caratteri.
Banca dati Nome del database in cui si sta inviando l'output. Il nome del database deve essere univoco all'interno del cluster.
Authentication Un'identità gestita da Microsoft Entra ID, che consente al cluster di accedere facilmente ad altre risorse protette di Microsoft Entra, ad esempio Azure Key Vault. L'identità viene gestita dalla piattaforma Azure e non è necessario configurare o cambiare alcun segreto. La configurazione dell'identità gestita è attualmente supportata solo per abilitare le chiavi gestite dal cliente per il cluster.
Tabella Nome della tabella in cui viene scritto l'output. Il nome della tabella fa distinzione tra maiuscole e minuscole. Lo schema di questa tabella deve corrispondere esattamente al numero di campi e ai relativi tipi generati dall'output del processo.

Partitioning

Il partizionamento deve essere abilitato ed è basato sulla PARTITION BY clausola nella query. Quando l'opzione Eredita partizionamento è abilitata, segue il partizionamento dell'input per le query completamente eseguibili in parallelo.

Quando usare Analisi di flusso di Azure e Esplora dati di Azure

Le caratteristiche di Analisi di flusso di Azure includono:

  • Motore di elaborazione dei flussi: analisi in tempo reale continue e in streaming
  • Basato sul lavoro
  • Finestra di retrospettiva da 1 millisecondo a 7 giorni per l'analisi temporale in memoria e l'elaborazione del flusso
  • Inserimento da Hub Eventi di Azure e Hub IoT di Azure con latenza inferiore al secondo

Le caratteristiche di Esplora dati di Azure includono:

  • Motore analitico: analisi interattiva in tempo reale su richiesta
  • Inserimento di dati in streaming in un archivio dati persistente, insieme alle funzionalità di query
  • Inserimento di dati da Hub Eventi, Hub IoT, Azure Blob Storage, Azure Data Lake Storage, Kafka, Logstash, Spark e Azure Data Factory
  • Latenza da 10 secondi a 5 minuti per carichi di lavoro con velocità effettiva elevata
  • Trasformazione dei dati semplice tramite un criterio di aggiornamento durante l'inserimento

È possibile aumentare significativamente l'ambito dell'analisi in tempo reale usando Analisi di flusso di Azure e Esplora dati di Azure insieme. Ecco alcuni scenari:

  • Analisi di flusso identifica le anomalie in tempo reale e Esplora dati di Azure consente di determinare come e perché si sono verificati tramite l'esplorazione interattiva.
  • Analisi di flusso deserializza i flussi di dati in ingresso da usare in Esplora dati di Azure( ad esempio, inserire il formato Protobuf usando un deserializzatore personalizzato o formati binari personalizzati).
  • Analisi di flusso può aggregare, filtrare, arricchire e trasformare i flussi di dati in ingresso da usare in Esplora dati di Azure.

Altri scenari e limitazioni

  • Il nome delle colonne e del tipo di dati deve corrispondere tra la query SQL di Analisi di flusso di Azure e la tabella di Esplora dati di Azure. Il confronto fa distinzione tra maiuscole e minuscole.
  • Le colonne presenti nei cluster di Esplora dati di Azure ma mancanti in Analisi di flusso di Azure vengono ignorate. Le colonne mancanti in Analisi di flusso di Azure generano un errore.
  • L'ordine delle colonne nella query di Analisi di flusso di Azure non è rilevante. Lo schema della tabella di Esplora dati di Azure determina l'ordine.
  • Esplora dati di Azure ha un criterio di aggregazione (invio in batch) per l'inserimento dati progettato per ottimizzare il processo di inserimento. I criteri sono configurati per 5 minuti, 1.000 elementi o 1 GB di dati per impostazione predefinita, quindi è possibile che si verifichi una latenza. Per ridurre la latenza, abilitare l'inserimento in streaming nel cluster e quindi tabella o database seguendo la procedura descritta in Configurare l'inserimento in streaming nel cluster di Esplora dati di Azure. Per le opzioni di aggregazione, vedere politica di IngestionBatching.

Passaggi successivi