Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Importante
Questa funzionalità è in Anteprima Pubblica.
Questa pagina illustra come creare e gestire ambienti di base serverless in un'area di lavoro.
Permissions
- Solo gli amministratori dell'area di lavoro possono creare e gestire gli ambienti di base di un'area di lavoro.
- Tutti gli utenti dell'area di lavoro hanno accesso agli ambienti di base di un'area di lavoro.
- Tutti gli utenti dell'area di lavoro possono creare specifiche di ambiente serverless personalizzate.
Funzionamento degli ambienti di base in Azure Databricks
In Azure Databricks un ambiente di base è una specifica YAML condivisibile che definisce una versione dell'ambiente serverless e un set di dipendenze Python aggiuntive per notebook serverless. Gli amministratori dell'area di lavoro creano e gestiscono ambienti di base in modo che gli utenti possano iniziare rapidamente da un ambiente coerente e memorizzato nella cache e, facoltativamente, aggiungere le proprie librerie.
Usare gli ambienti di base dello spazio di lavoro
Gli utenti possono selezionare un ambiente di base dell'area di lavoro dall'elenco a discesa Ambiente di base nel pannello laterale Ambiente . Gli ambienti di base dell'area di lavoro vengono visualizzati nell'elenco a discesa insieme ad altre opzioni, ad esempio Standard, intelligenza artificiale e Personalizzato.
Quando si seleziona un ambiente di base dell'area di lavoro, l'ambiente memorizzato nella cache predefinito viene caricato rapidamente, riducendo il tempo di avvio per notebook e processi. Per i processi, l'uso degli ambienti di base dell'area di lavoro migliora le prestazioni perché le dipendenze sono già memorizzate nella cache.
Utilizzare gli ambienti base dell'area di lavoro
Gli utenti possono selezionare un ambiente di base dell'area di lavoro per un notebook usando l'impostazione Ambiente di base nel pannello laterale Ambiente del notebook.
Quando si seleziona un ambiente di base dell'area di lavoro, l'ambiente memorizzato nella cache predefinito viene caricato rapidamente, riducendo il tempo di avvio per notebook e processi. Per le attività sui notebook nei lavori, l'uso degli ambienti base dell'area di lavoro migliora le prestazioni perché le dipendenze sono già memorizzate nella cache.
Per istruzioni sulla configurazione degli ambienti di base in un notebook, vedere Selezionare un ambiente di base.
Creare ed esportare una specifica di ambiente
Il modo più semplice per creare una specifica YAML valida consiste nel compilare l'ambiente nel pannello laterale Ambiente e quindi usare il pulsante Esporta ambiente per scaricare il file YAML.
- Aprire un notebook e connettersi al calcolo serverless.
- Fare clic
Nel pannello laterale del notebook.
- In Ambiente di base selezionare Standard o Usa altro per scegliere una versione specifica dell'ambiente. Databricks consiglia di usare la versione più recente dell'ambiente serverless supportata dall'area di lavoro.
- Nel campo Dipendenze aggiungere le dipendenze desiderate per l'ambiente di base. Fare clic su Aggiungi dipendenza dopo aver immesso ogni dipendenza. Per altre istruzioni sull'aggiunta di dipendenze, vedere Aggiungere dipendenze al notebook.
- Fare clic su Applica nella parte inferiore del pannello dell'ambiente per verificare che la specifica sia valida.
- Fare clic
Nella parte inferiore del pannello dell'ambiente fare clic su Esporta ambiente.
- Assegnare un nome al file YAML e aggiungerlo a una cartella workspace o a un volume del catalogo Unity.
Specifica dell'ambiente di esempio
L'esempio YAML seguente si basa sulla specifica dell'ambiente dei progetti MLflow. Definisce un ambiente di base con alcune dipendenze della libreria:
environment_version: '4'
dependencies:
- --index-url https://pypi.org/simple
- -r "/Workspace/Shared/requirements.txt"
- my-library==6.1
- /Workspace/Shared/Path/To/simplejson-3.19.3-py3-none-any.whl
- git+https://github.com/databricks/databricks-cli
Aggiungere un ambiente di base all'area di lavoro
Per aggiungere la specifica dell'ambiente come ambiente di base all'area di lavoro:
- Nell'area di lavoro passare a Impostazioni.
- In Amministratore dell'area di lavoroselezionare Calcolo.
- Accanto a Ambienti di base per il calcolo serverless fare clic su Gestisci.
- Fare clic su Crea nuovo ambiente.
- Assegnare un nome all'ambiente di base. Si tratta del nome visualizzato dagli utenti nel menu a discesa Ambiente di base .
- Selezionare il file YAML di specifica dell'ambiente usando la selezione file. È possibile esplorare i file dell'area di lavoro o i volumi del catalogo Unity.
- Clicca su Crea.
L'ambiente di base inizierà a creare. Controllare la colonna Stato nell'elenco degli ambienti di base. Verrà modificato in Pronto per l'uso quando è pronto.
Compilazione per il calcolo GPU serverless
Importante
Questa funzionalità è in versione beta. Gli amministratori dell'area di lavoro possono controllare l'accesso a questa funzionalità dalla pagina Anteprime . Vedere Gestire le anteprime di Azure Databricks.
Quando si crea un ambiente di base, è possibile abilitare facoltativamente la casella di controllo Build for Serverless GPU Compute per compilare l'ambiente per i carichi di lavoro GPU. Verrà creata una versione compatibile con GPU dell'ambiente di base visualizzata nella scheda GPU .
La pagina di gestione degli ambienti di base include due schede:
- CPU: elenca gli ambienti di base per il calcolo serverless (carichi di lavoro non GPU).
- GPU: elenca gli ambienti di base per il calcolo GPU serverless. Questa scheda mostra anche le righe dell'ambiente di intelligenza artificiale che corrispondono agli ambienti di base di intelligenza artificiale. Per altre informazioni, vedere Ambiente di intelligenza artificiale.
Standard Latest si riferisce alla versione più recente dell'ambiente di base standard stabile fornita da Databricks.
Annotazioni
I record di utilizzo associati alla compilazione e all'aggiornamento degli ambienti di base hanno la colonna billing_origin_product impostata su BASE_ENVIRONMENTS. Inoltre, l'ID specifico dell'ambiente di base viene popolato nella colonna usage_metadata.base_environment_id.
Impostare l'ambiente di base predefinito dell'area di lavoro
Per impostazione predefinita, i notebook serverless in un'area di lavoro non usano un ambiente di base. Gli amministratori dell'area di lavoro possono selezionare un ambiente di base da applicare a tutti i nuovi notebook per impostazione predefinita.
- Nell'area di lavoro passare a Impostazioni.
- In Amministratore dell'area di lavoroselezionare Calcolo.
- Accanto a Ambienti di base per il calcolo serverless fare clic su Gestisci.
- Fare clic sull'icona a forma di stella accanto all'ambiente di base per impostarla come predefinita.
Tutti i nuovi notebook serverless verranno ora predefinito per l'ambiente di base selezionato.
Aggiornare un ambiente di base
È possibile modificare il file di ambiente di base per aggiornare i numeri di versione o aggiungere o rimuovere dipendenze.
Nell'elenco degli ambienti di base fare clic sul percorso del file YAML dell'ambiente di base da aggiornare. Verrà aperto il file in una nuova scheda. È possibile esaminare o aggiornare il contenuto del file. Le modifiche vengono salvate automaticamente.
Dopo aver eseguito un aggiornamento alla specifica YAML, è necessario aggiornare l'ambiente di base in modo che i notebook e i processi rilevino la configurazione più recente.
- Accanto all'ambiente di base che si desidera aggiornare, fare clic
quindi selezionare Aggiorna.
- Cliccare Conferma.
Le nuove sessioni ora usano l'ambiente di base aggiornato. Per ottenere gli aggiornamenti, è necessario riavviare le sessioni del notebook esistenti.
Limitazioni
Gli ambienti di base presentano le limitazioni seguenti:
- Gli ambienti di base personalizzati sono supportati solo per i tipi di attività serverless Python, Python wheel e notebook. Altri tipi di attività non sono supportati.
- Gli ambienti di base di workspace non sono supportati nei job. L'unica eccezione è costituita dalle attività del notebook, che possono usare gli ambienti di base dell'area di lavoro solo quando l'ambiente è configurato direttamente nelle impostazioni dell'ambiente del notebook.
- Le pipeline dichiarative di Lakeflow Spark non supportano gli ambienti di base.
- In fase di esecuzione vengono installate solo le dipendenze pertinenti.
- L'ambiente serverless versione 1 non è supportato. Usare la versione 2 o successiva.
- Gli ambienti di base sono disponibili per tutti gli utenti dell'area di lavoro.
- Le aree di lavoro sono limitate a 10 ambienti di base.