Linee guida per il dimensionamento delle macchine virtuali host di sessione per Azure Virtual Desktop e Servizi Desktop Remoto

Si applica a: ✅ Windows Server 2025, ✅ Windows Server 2022, ✅ Windows Server 2019, ✅ Windows Server 2016, ✅ Windows 11, ✅ Windows 10

Il dimensionamento degli host di sessione per Desktop virtuale Azure e Servizi Desktop remoto richiede un'attenta considerazione dei tipi di carico di lavoro e delle configurazioni hardware. Diversi tipi di carichi di lavoro richiedono configurazioni hardware diverse per garantire prestazioni ottimali.

Esistono due tipi di host di sessione da considerare quando vengono ridimensionati in modo appropriato per gli utenti:

Sessione singola: dedicata a un singolo utente alla volta.
Multisessione: condiviso tra più utenti contemporaneamente.

In un ambiente in cui i desktop e le app sono accessibili in modalità remota, l'esecuzione e l'elaborazione dei dati si verificano nell'host sessione, a meno che le app non supportino l'offload locale. Il dimensionamento corretto di ogni host di sessione e del numero di host di sessione è importante, quindi non si esauriscono le risorse durante i carichi di picco, che altrimenti causano interruzioni agli utenti.

Gli host di sessione possono essere eseguiti su macchine virtuali o su hardware fisico per Servizi Desktop remoto. Le macchine virtuali hanno un sovraccarico, quindi è consigliabile tenere conto di questo quando si ridimensionano gli host di sessione, illustrati in questo articolo.

Gli esempi in questo articolo sono linee guida generiche ed è consigliabile usarli solo per le stime iniziali delle prestazioni. Per un'esperienza ottimale, ridimensionare la distribuzione in base alle esigenze degli utenti.

Pianificazione della capacità

La capacità e le risorse che è necessario fornire sono diverse per tutti, perché dipendono da molti fattori che contribuiscono. La pianificazione della capacità è il processo di determinazione degli host di sessione e delle relative risorse necessarie per soddisfare le richieste di carico di lavoro previste. Implica l'analisi delle esigenze di risorse correnti e future, la stima del numero di utenti per host sessione e la determinazione delle dimensioni appropriate per garantire prestazioni ottimali.

Quando si pianifica la capacità per gli host di sessione, considerare le aree seguenti:

Area	Descrzione
Carico di lavoro utente	Comprendere i tipi di app e attività eseguite dagli utenti. I diversi carichi di lavoro hanno requisiti di risorse diversi, ad esempio CPU, memoria e archiviazione.
Conteggio utenti	Stimare il numero di utenti simultanei che accedono agli host sessione. Ciò consente di determinare le risorse necessarie per supportare il carico utente previsto.
Requisiti delle risorse	Analizzare i requisiti delle risorse delle app e delle attività eseguite dagli utenti. Sono inclusi CPU, memoria, archiviazione e larghezza di banda di rete.
Aspettative sulle prestazioni	Definire le aspettative sulle prestazioni per gli host di sessione, ad esempio il tempo di risposta, l'ora di accesso, l'ora di avvio dell'applicazione e l'esperienza utente complessiva. Prendere in considerazione le prestazioni di accesso per i tempi chiave, come l'inizio di una giornata lavorativa o di un turno, poiché possono influire sulle prestazioni rispetto a uno stato costante.
Scalabilità	Prendere in considerazione la possibilità di ridimensionare gli host di sessione man mano che aumentano le richieste degli utenti. Ciò potrebbe comportare l'aggiunta di più host di sessione o il ridimensionamento di quelli esistenti per supportare utenti o carichi di lavoro aggiuntivi.
Resilienza e ridondanza	Prendere in considerazione l'implementazione di meccanismi di ridondanza e failover per garantire la disponibilità elevata e ridurre al minimo i tempi di inattività in caso di errori hardware o software.
Monitoraggio e ottimizzazione	Implementare gli strumenti di monitoraggio per tenere traccia dell'utilizzo delle risorse e delle metriche delle prestazioni. Usare questi dati per ottimizzare gli host di sessione e apportare modifiche in corso in base alle esigenze.

I due approcci seguenti vengono comunemente usati per determinare la capacità degli host di sessione:

Approccio pilota: distribuire un singolo server di test e aumentare gradualmente il carico monitorando al tempo stesso i feedback degli utenti e gli indicatori di prestazioni del sistema, ad esempio CPU, paging, disco e rete. Questo approccio è affidabile per le distribuzioni più piccole, ma potrebbe richiedere investimenti hardware iniziali che potrebbero non soddisfare gli obiettivi di distribuzione finali.
Approccio di simulazione: usare gli strumenti di automazione per generare carichi di lavoro utente simulati che simulano il comportamento dell'utente reale. In genere, la simulazione comporta l'aumento graduale del numero di utenti simulati nel tempo e le metriche delle prestazioni vengono raccolte durante il test. L'analisi consente di identificare il punto in cui le prestazioni diminuiscono oltre le soglie accettabili. Questo approccio è più adatto per distribuzioni di grandi dimensioni, in cui la determinazione accurata della capacità influisce significativamente sulle decisioni di acquisto.

La distribuzione pilota tende a essere più efficiente in termini di tempo e costi per le distribuzioni più piccole, mentre l'approccio di simulazione potrebbe essere più adatto per distribuzioni di dimensioni maggiori, in cui determinare con precisione la capacità del session host può influenzare decisamente le decisioni di acquisto.

Indipendentemente dall'approccio usato, è anche necessario considerare i tempi chiave per l'accesso dell'utente, ad esempio l'inizio di un giorno lavorativo o il turno, che può influire sulle prestazioni rispetto a uno stato stabile e causare tempi di accesso lunghi. Un host di sessione potrebbe essere in grado di supportare un numero sufficiente di utenti per un determinato scenario, ma potrebbe non avere la capacità di gestire tutti gli utenti che accedono simultaneamente. Pianificare anche un po' di margine per soddisfare picchi imprevisti nell'attività degli utenti o nelle richieste di risorse.

È consigliabile documentare il processo di pianificazione della capacità, inclusi presupposti, calcoli e decisioni prese. Comunicare il piano agli stakeholder per garantire l'allineamento e la comprensione.

Fattori chiave che influiscono sulla capacità e sulle prestazioni

Esistono diversi fattori chiave che influiscono sulla capacità degli host di sessione. La comprensione di questi fattori consente di prendere decisioni informate sul dimensionamento e sulla scalabilità degli host di sessione.

Ridimensionamento CPU:
- Il numero di core CPU influisce direttamente sul numero di utenti che possono essere supportati in una macchina virtuale host di sessione.
- Il raddoppio del numero di core CPU non raddoppia necessariamente la capacità dell'utente a causa di un calo dei ritorni e del sovraccarico di sincronizzazione. Il fattore di ridimensionamento è maggiore quando il numero iniziale di CPU è ridotto e diminuisce man mano che il numero di core aumenta. Ad esempio, il fattore di ridimensionamento che passa da 4 core a 8 core è maggiore di quello che passa da 8 core a 16 core.
- Il fattore di ridimensionamento varia in genere tra 1,5 e 1,9, ovvero per ogni core aggiuntivo, è possibile prevedere un aumento proporzionale della capacità utente, ma non uno lineare.
Impatto sulla memoria:
- La quantità di memoria allocata a una macchina virtuale host sessione influisce direttamente sul numero di utenti che può supportare.
- Quando la memoria è il fattore di limitazione, l'aggiunta di più memoria a capacità inferiori può migliorare significativamente le prestazioni. Ad esempio, l'aumento della memoria da 8 GB a 16 GB può superare il doppio del numero di utenti che è possibile supportare.
Impatto dell'accesso utente:
- L'accesso utente è un'operazione a elevato utilizzo della CPU e le frequenze di accesso simultanee elevate possono influire significativamente sulle prestazioni del sistema.
- Pianificare i modelli di accesso previsti, ad esempio l'inizio di una giornata lavorativa alle 9:00, in cui molti utenti accedono contemporaneamente. In caso contrario, gli utenti potrebbero riscontrare tempi di accesso estesi.
Overhead della virtualizzazione
- L'esecuzione in macchine virtuali può comportare un costo di capacità del 15-20% rispetto al bare metal, in base ai test interni.
- Un hypervisor introduce una maggiore latenza e un sovraccarico della CPU che può comportare tempi di risposta dell'utente pari a 10% a 20% superiori rispetto al bare metal.
Vantaggi dell'hyperthreading
- L'hyperthreading può migliorare la capacità utente consentendo l'esecuzione simultanea di più thread in ogni core, rendendo più efficiente l'uso delle risorse del processore.
- I vantaggi dell'hyperthreading variano a seconda del carico di lavoro e del numero di core. I carichi di lavoro con un uso meno intensivo della CPU possono trarre vantaggio da funzionalità di elaborazione parallele aggiuntive e ottenere prestazioni migliori tramite l'hyperthreading.
Prestazioni di rete
- La latenza di rete, perdita di pacchetti e instabilità possono influire sull'esperienza utente, in particolare per le applicazioni che richiedono frequenti comunicazioni con server o database remoti. Qualsiasi combinazione di latenza elevata, perdita di pacchetti e instabilità può causare tempi di risposta più lenti e prestazioni ridotte.
- Un RTT di rete inferiore, la perdita di pacchetti e l'instabilità portano a tempi di risposta più rapidi e prestazioni complessive migliori. Provare a usare connessioni di rete a bassa latenza per ridurre al minimo l'impatto delle prestazioni di rete sull'esperienza utente.
Prestazioni di archiviazione
- Le prestazioni di archiviazione possono influire sull'esperienza utente, in particolare per le applicazioni che richiedono un accesso frequente al disco.
- Usare soluzioni di archiviazione ad alte prestazioni, ad esempio unità SSD o NVMe, per garantire un accesso rapido ai dati e ridurre al minimo la latenza.
Requisiti dell'unità di elaborazione grafica (GPU)
- Alcuni carichi di lavoro, ad esempio applicazioni a elevato utilizzo di grafica per il rendering video, la progettazione 3D e le simulazioni o desktop virtuali con schermi ad alta risoluzione, potrebbero richiedere GPU dedicate per garantire prestazioni ottimali.
- Prendere in considerazione l'uso di host di sessione con funzionalità GPU se gli utenti eseguono applicazioni a elevato utilizzo di grafica o richiedono schermi ad alta risoluzione.

Tutti questi fattori possono influire sulle prestazioni complessive e sulla capacità degli host di sessione. La misurazione del ritardo di input dell'utente o del tempo di risposta della sessione end-to-end è una metrica chiave da considerare quando si valutano le prestazioni per gli utenti. Questa metrica misura il tempo necessario per elaborare e riflettere l'input di un utente nella sessione, fornendo una rappresentazione più accurata dell'esperienza utente. Gli utenti in genere prevedono un tempo di risposta inferiore a 200 millisecondi per le azioni e qualsiasi ritardo superiore a questo può causare un'esperienza utente danneggiata. Per altre informazioni sulla misurazione dell'esperienza utente, vedere Usare i contatori delle prestazioni per diagnosticare i problemi di prestazione delle app su Host di sessione Desktop remoto.

Carichi di lavoro

Quando si ridimensionano gli host di sessione, è importante considerare il tipo di carico di lavoro eseguito dagli utenti in quanto possono essere notevolmente diversi. Ad esempio, gli operatori per l'immissione di dati poco pesante hanno un utilizzo ridotto delle risorse che porta a una densità utente elevata. Tuttavia, i lavoratori esperti che usano app 3D pesanti usano risorse più elevate che porterebbero a bassa densità utente con lo stesso hardware.

Ecco un esempio che classifica i carichi di lavoro in quattro tipi: luce, media, pesante e potenza. Ogni tipo di carico di lavoro ha requisiti di risorsa e aspettative dell'utente diversi.

La tabella seguente descrive ogni carico di lavoro. Gli utenti di esempio sono i tipi di utenti che potrebbero trovare ogni carico di lavoro più utile. Le app di esempio sono i tipi di app che funzionano meglio per ogni carico di lavoro.

Tipo di carico di lavoro	Utenti di esempio	App di esempio
Light	Utenti che svolgono attività di base di immissione di dati	Applicazioni per voci in database, interfacce a riga di comando
Intermedio	Consulenti e ricercatori di mercato	App per l'inserimento dati nei database, interfacce a riga di comando, Microsoft Word, pagine web statiche
Heavy	Ingegneri informatici, creatori di contenuti	App di immissione di database, interfacce della riga di comando, Microsoft Word, pagine Web statiche, Microsoft Outlook, Microsoft PowerPoint, pagine Web dinamiche, sviluppo software
Potenza	Designer grafici, creatori di modelli 3D, ricercatori di Machine Learning	App di immissione di database, interfacce della riga di comando, Microsoft Word, pagine Web statiche, Microsoft Outlook, Microsoft PowerPoint, pagine Web dinamiche, modifica di foto e video, progettazione a supporto informatico (CAD), produzione a supporto informatico (CAM)

Raccomandazioni per il dimensionamento dell'host per una singola sessione

In uno scenario a sessione singola, solo un utente può accedere a un host di sessione alla volta. Ad esempio, se si usano pool di host personali in Desktop virtuale Azure, si usa uno scenario a sessione singola.

Queste raccomandazioni di dimensionamento per gli scenari a sessione singola si basano sulle macchine virtuali di Azure. È anche possibile usare queste figure come baseline per gli host di sessioni fisiche, prendere in considerazione l'approccio di pianificazione della capacità per perfezionare queste raccomandazioni per i carichi di lavoro.

È consigliabile usare almeno due core CPU fisici per macchina virtuale, in genere quattro vCPU con hyper-threading. Se sono necessarie raccomandazioni di dimensionamento delle macchine virtuali più specifiche per scenari a sessione singola, chiedere ai fornitori di software specifici del carico di lavoro. Il ridimensionamento delle macchine virtuali per gli host di sessione singola è in genere allineato alle linee guida per i dispositivi fisici.

La tabella seguente mostra esempi di carichi di lavoro tipici:

Tipo di carico di lavoro	Requisiti minimi di archiviazione per vCPU, RAM e sistema operativo	Istanze di Azure di esempio	Archiviazione minima dei contenitori del profilo
Light	2 vCPU, 8 GB di RAM, 32 GB di spazio di archiviazione	D2s_v5, D2s_v4	30 GB
Intermedio	4 vCPU, 16 GB di RAM, 32 GB di spazio di archiviazione	D4s_v5, D4s_v4	30 GB
Heavy	8 vCPU, 32 GB di RAM, 32 GB di spazio di archiviazione	D8s_v5, D8s_v4	30 GB

Raccomandazioni per il dimensionamento degli host di sessioni multisessione

In uno scenario con più sessioni, molti utenti sono connessi a una macchina virtuale sessione host in qualsiasi momento. Ad esempio, quando si usano pool di host condivisi in Azure Virtual Desktop con il sistema operativo Windows 11 Enterprise multisessione, si tratta di una distribuzione multisessione.

Un ambiente di elaborazione multisessione presenta carichi di picco significativamente più elevati rispetto agli ambienti a sessione singola. Un host di sessione con una capacità hardware specifica ha un limite massimo di carico di lavoro che può supportare prima che le risorse vengano esaurite.

Queste raccomandazioni di dimensionamento per gli scenari con più sessioni si basano sulle macchine virtuali di Azure. È anche possibile usare queste figure come baseline per gli host di sessioni fisiche, prendere in considerazione l'approccio di pianificazione della capacità per perfezionare queste raccomandazioni per i carichi di lavoro.

La tabella seguente elenca il numero massimo consigliato di utenti per ogni unità di elaborazione centrale virtuale (vCPU) e la configurazione minima della macchina virtuale per un carico di lavoro utente standard o superiore. Se sono necessarie raccomandazioni di dimensionamento delle macchine virtuali più specifiche per scenari a sessione singola, chiedere ai fornitori di software specifici del carico di lavoro.

Tipo di carico di lavoro	Numero massimo di utenti per vCPU	Archiviazione minima di vCPU/RAM/sistema operativo	Istanze di Azure di esempio	Archiviazione minima dei profili
Light	6	8 vCPU, 16 GB di RAM, 32 GB di spazio di archiviazione	D8s_v5, D8s_v4, F8s_v2, D8as_v4, D16s_v5, D16s_v4, F16s_v2, D16as_v4	30 GB
Intermedio	4	8 vCPU, 16 GB di RAM, 32 GB di spazio di archiviazione	D8s_v5, D8s_v4, F8s_v2, D8as_v4, D16s_v5, D16s_v4, F16s_v2, D16as_v4	30 GB
Heavy	2	8 vCPU, 16 GB di RAM, 32 GB di spazio di archiviazione	D8s_v5, D8s_v4, F8s_v2, D8as_v4, D16s_v5, D16s_v4, F16s_v2, D16as_v4	30 GB
Potenza	1	6 vCPU, 56 GB di RAM, 340 GB di spazio di archiviazione	D16ds_v5, D16s_v4, D16as_v4, NV6, NV16as_v4	30 GB

Per i carichi di lavoro con più sessioni, è necessario limitare le dimensioni delle macchine virtuali a un massimo di 4 vCPU e 24 vCPU per i motivi seguenti:

Tutte le macchine virtuali devono avere più di due core. I componenti dell'interfaccia utente in Windows si basano sull'uso di almeno due thread paralleli per alcune delle operazioni di rendering più pesanti. Per gli scenari multisessione, la presenza di più utenti in una macchina virtuale a due core comporta l'instabilità dell'interfaccia utente e delle app, che riduce la qualità dell'esperienza utente. Quattro core sono il numero più basso consigliato di core che deve avere una macchina virtuale a più sessioni stabile.
Le macchine virtuali non devono avere più di 32 core. Con l'aumentare del numero di core, aumenta anche il sovraccarico di sincronizzazione del sistema. Per la maggior parte dei carichi di lavoro, a circa 16 core, il ritorno sugli investimenti diminuisce, poiché la maggior parte della capacità aggiuntiva è compensata dal sovraccarico di sincronizzazione. L'esperienza utente è migliore con due macchine virtuali a 16 core anziché una macchina virtuale a 32 core.

L'intervallo consigliato tra 4 e 24 core offre in genere prestazioni migliori per gli utenti man mano che si aumenta il numero di core. Ad esempio, se si hanno 12 utenti che accedono contemporaneamente a una macchina virtuale con quattro core, il rapporto è di tre utenti per core. In una macchina virtuale con 8 core e 14 utenti, il rapporto è di 1,75 utenti per core. In questo scenario, quest'ultima configurazione con un rapporto di 1,75 offre una maggiore capacità di burst per le applicazioni con una domanda di CPU a breve termine.

Questa raccomandazione è vera su larga scala. Per gli scenari con 20 o più utenti connessi a una singola macchina virtuale, diverse macchine virtuali più piccole offrono prestazioni migliori rispetto a una o due macchine virtuali di grandi dimensioni. Ad esempio, se si prevede che 30 o più utenti stiano per accedere in contemporanea entro 10 minuti nello stesso host di sessione con 16 core, due macchine virtuali da 8 core gestiranno meglio il carico di lavoro. È anche possibile usare il bilanciamento del carico in ampiezza per distribuire uniformemente gli utenti tra macchine virtuali diverse, anziché il bilanciamento del carico in profondità, in cui è possibile usare un nuovo host di sessione solo dopo che quello esistente è pieno di utenti.

È anche preferibile usare un numero elevato di macchine virtuali più piccole anziché alcune macchine virtuali di grandi dimensioni. È più facile arrestare le macchine virtuali che devono essere aggiornate o non sono attualmente in uso. Con macchine virtuali di dimensioni maggiori, è più probabile che almeno un utente abbia eseguito l'accesso in qualsiasi momento, impedendo così di arrestare la macchina virtuale. Quando si hanno molte macchine virtuali più piccole, è più probabile che si disponga di alcune macchine virtuali senza utenti attivi. È possibile arrestare queste macchine virtuali inutilizzate in modo sicuro per risparmiare risorse, manualmente o automaticamente usando la scalabilità automatica in Desktop virtuale Azure. La conservazione delle risorse rende la distribuzione più resiliente, più facile da gestire e meno costosa.

Usare i contatori delle prestazioni per diagnosticare i problemi di prestazioni delle app in host sessione Desktop remoto.
Whitepaper sulla pianificazione della capacità di Windows Server 2025 (PDF) per indicazioni più approfondite sulla pianificazione delle distribuzioni di Servizi Desktop Remoto di Windows Server 2025.

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2026-02-24