Condividi tramite


Esegui test e visualizza i risultati

[Questo articolo fa parte della documentazione non definitiva, pertanto è soggetto a modifiche.]

Esegui valutazioni e analizza i risultati per ottimizzare il comportamento del tuo agente e confermare che il tuo agente soddisfi i requisiti di business e qualità. Puoi anche eseguire un set di test più volte per vedere i cambiamenti nel tempo man mano che migliori il tuo agente.

I risultati dei test sono disponibili presso Copilot Studio per 89 giorni. Per salvare i risultati dei test per un periodo più lungo, esporta i risultati in un file CSV.

Esegui un test con un set di test

Dopo aver creato un set di test, esegui un test usando quel set. Oppure, rieseguire test usando lo stesso set per confrontare i risultati nel tempo e nelle iterazioni. Un test può richiedere fino a pochi minuti per essere eseguito. Puoi eseguire un solo test alla volta.

Importante

Le valutazioni degli agenti che utilizzano l'autenticazione utente richiedono l'accesso tramite il connettore Microsoft Copilot Studio. Se il tuo amministratore disattiva questa connessione, non puoi eseguire test usando lo strumento di valutazione. Per ulteriori informazioni, vedi connettori e gruppi dati Copilot Studio.

  1. Vai alla pagina Valutazione del tuo agente.

Screenshot che mostra come selezionare la scheda Valutazione quando la selezione delle schede è compressa a causa della dimensione dello schermo.

  1. Esegui un test eseguendo una delle seguenti azioni:

    • Alla fine della creazione o modifica di un set di test, seleziona Valuta.
    • Nella sezione Risultati recenti , rieseguire un test seguendo uno dei seguenti passaggi:
      • Passa il mouse sul risultato del test che vuoi valutare, seleziona i tre punti (...) e poi seleziona di nuovo Valuta set di test.
      • Seleziona il risultato del test per aprirlo, poi seleziona i tre punti (...) nel pannello riepilogo della valutazione , e infine seleziona di nuovo Valuta set di test.

    Se il profilo utente del set di test ha connessioni rotte, o se il set di test non ha un profilo utente, appare la finestra di dialogo Gestisci connessioni . Non è necessario usare un profilo utente per i test. Tuttavia, se usi un profilo, tutte le connessioni devono funzionare. Per informazioni su come riparare le connessioni, vedi Gestisci profili utente e connessioni.

Una valutazione può richiedere alcuni minuti. Un avviso appare in Copilot Studio quando i risultati del test sono pronti per essere visualizzati.

Approfondisci i risultati dei test

Ogni volta che esegui una valutazione con un set di test, Copilot Studio:

  1. Usa l'account utente connesso per simulare le conversazioni con l'agente, inviando ogni domanda nel test case all'agente.

  2. Raccoglie le risposte dell'agente.

  3. Misura e analizza il successo di ogni risposta. Ogni caso di test riceve un Pass, Fail, Invalido o Errore in base ai criteri del caso di test.

  4. Assegna un punteggio di tasso di superamento in base al tasso di superamento/ e al tasso di mancato superamento del set di test.

Puoi vedere il tasso di superamento di ogni set di test eseguito nella pagina Valutazione del tuo agente, sotto Risultati recenti. Per visualizzare più esecuzioni del set di test, seleziona Vedi tutto.

Screenshot che mostra un elenco di valutazioni precedenti.

Vedi e valuta un'analisi dettagliata per un caso di prova

Quando apri un risultato di test, vedi i dettagli della prova, una lista delle query usate nel test, come ha risposto l'agente e il punteggio Pass or Fail .

Seleziona un caso di prova nell'elenco per vedere una valutazione dettagliata di ogni risposta. Seleziona Tutti, Passa o Fallisce per filtrare i casi per risultato.

Screenshot che mostra una lista di casi di test all'interno di una valutazione completata, con i filtri evidenziati.

La valutazione include le risposte attese e reali, il ragionamento dietro il risultato del test e le conoscenze, gli argomenti e gli strumenti utilizzati dall'agente per rispondere.

Screenshot che mostra il risultato dettagliato e la valutazione di un test case.

  1. I risultati della valutazione. Questo esempio mostra i dettagli del risultato di una valutazione di qualità.

  2. Seleziona Mostra mappa attività per vedere la sequenza di input, decisioni e output del tuo agente all'interno di un caso di test. Per maggiori informazioni sulla visualizzazione delle mappe di attività, vedi Visualizza attività della sessione.

  3. La trascrizione della domanda del test e la risposta dell'agente.

  4. Le risorse utilizzate dall'agente nel test. Selezionane uno per aprirlo.

Puoi fornire un feedback a Microsoft su quanto bene la valutazione sia andata per ogni caso di test. Questo feedback riguarda specificamente quanto efficacemente il metodo di valutazione selezionato abbia valutato la risposta, non se la risposta stessa fosse corretta. Il tuo feedback aiuta a migliorare la qualità e l'accuratezza delle valutazioni nel tempo.

Per valutare una valutazione, seleziona lo schermo con il pollice in su che mostra un'icona con il pollice in su per inviare un feedback positivo su una valutazione di caso di test. oppure pollice giù Screenshot che mostra un'icona con pollice giù per inviare feedback negativi su una valutazione di caso di test. icona nel pannello dettagli del caso di test. Quando si apre il modulo di feedback, fornisci maggiori dettagli sulla tua valutazione e poi seleziona Invia.

Confronta i risultati dei test

Vuoi testare una versione del tuo agente e vedere i cambiamenti nelle prestazioni prima e dopo aver effettuato le modifiche. Puoi confrontare due esecuzioni dello stesso set di test usando lo strumento Confronto con .

Per vedere un confronto, devi eseguire lo stesso set di test almeno due volte.

  1. Nella pagina Valutazione del tuo agente, sotto Risultati recenti dei test, apri la prova che vuoi usare come base per il confronto.

  2. Seleziona il menu a tendina Confronta con , poi seleziona l'ora e la data del test che vuoi confrontare con i risultati attualmente aperti.

Screenshot che mostra il menu a tendina Confronta con.

Nell'elenco dei casi di test , le frecce mostrano quali risultati di caso di test sono migliorati passando da fallimento a superatore , oppure diminuiti passando da superato a fallito .

Seleziona un caso di prova per vedere maggiori dettagli. Nel pannello riassunto della Valutazione puoi vedere un confronto diretto tra i punteggi del test, con il risultato del test attuale in cima.

Screenshot che mostra i risultati confrontati di due set di test.

Esportare i risultati dei test

Puoi esportare i risultati dei test in un file CSV. Il file elenca la domanda, la risposta attesa (se applicabile), il metodo di test, il punteggio di superamento (se applicabile), la risposta dell'agente, il risultato del test e l'analisi per ogni caso di test.

  1. Vai alla pagina Valutazione del tuo agente.
  2. Nella sezione Risultati recenti , esporta un risultato di test seguendo uno dei seguenti passaggi:
    • Passa il mouse sopra il caso di test che vuoi esportare, seleziona i tre punti (...) e poi seleziona Esporta risultati del test.
    • Seleziona il caso di test per aprirlo, seleziona i tre punti (...) nel pannello riassunto della Valutazione , e poi seleziona Esporta risultati del test.

I risultati del test scaricano come nome del tuo set di test.csv.