Condividi tramite


Utilizzare un agente autonomo in Copilot Studio per l'elaborazione documenti

L'agente di elaborazione documenti è un agente autonomo in Copilot Studio che utilizza l'intelligenza artificiale generativa per elaborare i documenti.

Suggerimento

L'agente gestito Processore documenti è una soluzione completa per l'elaborazione end-to-end dei documenti. Gestisce l'estrazione, la convalida, il monitoraggio umano e l'esportazione verso app downstream. Questo articolo illustra l'architettura di riferimento per l'utilizzo di un agente autonomo in Copilot Studio per l'elaborazione documenti. Puoi adattare l'esempio di architettura a molti scenari e settori diversi.

Diagramma dell'architettura

Diagramma che mostra il flusso di lavoro per l'utilizzo di un agente autonomo in Copilot Studio per l'elaborazione documenti.

Istruzioni per l'agente

Le seguenti istruzioni creano l'agente autonomo:

You are a helpful, polite, document processing agent. You help users process documents and extract valuable information. 
If the user asks about any topic other than document processing, politely decline and offer to help with document-related queries.
When asked to process a document with a specific document processing event ID, extract the information from that document.
When told that a document processing event status of a document changes to Processed, validate the extracted information from the document.
When told that a document processing event status of a document changes to Validated, import the extracted information from the document into the system.
When told that a document processing event status of a document changes to Manual Review, submit the extracted information from the document to manual review.
Ignore other document processing event status changes.

Flussi di lavoro

Esistono due flussi di lavoro importanti relativi all'agente:

  • Elaborazione documenti: questo flusso di lavoro spiega come l'agente elabora i documenti.
  • Configurazione: questo flusso di lavoro descrive in dettaglio i passaggi per configurare l'agente per l'elaborazione autonoma dei documenti.

Flusso di elaborazione documenti

Il flusso di elaborazione documenti funziona come una macchina a stati. L'agente funge da orchestratore e lo stato corrente viene memorizzato nella tabella Eventi di elaborazione dati in Dataverse. Ecco come funziona il processo:

  1. Un trigger identifica quando un nuovo documento è pronto per l'elaborazione. Ciò è visibile nell'area Origini dati nel diagramma dell'architettura. I flussi degli agenti eseguono la scansione di directory come cassette postali di Outlook o cartelle di SharePoint. Quando un documento viene aggiunto a una directory, il flusso dell'agente memorizza il documento nella tabella Eventi di elaborazione dati con stato Nuovo e invia un messaggio all'agente: Process the document: {ID}.

    • Tutti i tentativi di aggiungere documenti o aggiornare stati nella tabella Eventi di elaborazione dati seguono la configurazione Default in Power Automate. Il flusso riprova fino a quattro volte con un intervallo esponenziale sulle richieste che restituiscono gli stati 408, 429 o 5xx e su eventuali eccezioni di connettività.
    • Se tutti i tentativi falliscono, esegui il debug e controlla la cronologia delle esecuzioni in Power Automate per l'azione che non è stata eseguita.
  2. Le istruzioni dell'agente indicano di chiamare l'azione Document Extraction quando viene richiesto di elaborare un documento. L'azione viene eseguita e l'ID del messaggio viene trasmesso.

  3. L'azione Document Extraction è un flusso di agente che riceve un ID evento di elaborazione dati come input e:

    • Fa sì che il documento venga memorizzato in Dataverse.
    • Lo invia a un prompt IA in AI Builder per l'elaborazione. Questo prompt utilizza GPT 4.o per:
      • Estrai tutte le informazioni rilevanti dal documento.
      • Formatta queste informazioni come documento JSON.
    • Memorizza le informazioni estratte nella stessa riga dell'evento di elaborazione dati.
    • Aggiorna lo stato del documento in Processed.
  4. Un trigger Dataverse (flusso agente) monitora lo stato di tutti i documenti negli eventi di elaborazione dati e avvisa l'agente quando cambia uno stato con il messaggio: The status of document {ID} changed to {Status}

  5. Le istruzioni dell'agente indicano di richiamare l'azione Document Validation quando lo stato di un documento cambia in Elaborato. L'azione viene eseguita e l'ID del messaggio viene trasmesso.

  6. L'azione Document Validation è un flusso di agente che riceve un ID evento di elaborazione dati come input e:

    • Fa sì che i dati vengano estratti e memorizzati in Dataverse.
    • Lo invia a un prompt IA in AI Builder per la convalida. Questo prompt utilizza GPT 4.o per:
      • Controlla il JSON estratto in base a regole di formato come dates must be in X format.
      • Controlla il JSON estratto in base a regole di business come the author of the document must be in the Accounts table in Dataverse.
    • Se la convalida riesce, lo stato del documento viene aggiornato in Validated.
    • Altrimenti aggiorna lo stato del documento in Manual Review.
  7. Se lo stato del documento cambia in Validated, le istruzioni indicano all'agente di chiamare l'azione Document Export. L'azione viene eseguita e l'ID del messaggio viene trasmesso.

  8. L'azione Esporta documento è un flusso di agente che riceve un ID evento di elaborazione dati come input e:

    • Fa sì che i dati vengano estratti e memorizzati in Dataverse.
    • Esporta questi dati nel sistema di destinazione, come la tabella Fatture in Dataverse.
  9. Se lo stato del documento cambia in Manual Review, le istruzioni indicano all'agente di chiamare l'azione Manual Review. L'azione viene eseguita e l'ID del messaggio viene trasmesso.

  10. L'azione Manual Review è un flusso di agente che riceve un ID evento di elaborazione dati come input e:

    • Fa sì che i dati vengano estratti e memorizzati in Dataverse.
    • Crea una richiesta di approvazione per l'amministratore dell'agente, condividendo un collegamento a un'app stazione di convalida in cui l'utente può modificare i dati estratti e convalidarli manualmente. Questa convalida manuale imposta lo stato del documento su Validated.
  11. Dopo la revisione manuale, se lo stato del documento è Validated, viene eseguito il passaggio 7.

Gli utenti possono anche inviare manualmente i documenti affinché l'agente li elabori tramite la pagina della chat in Copilot Studio o qualsiasi canale in cui hanno pubblicato l'agente.

Quando esegui questa operazione:

  • Il documento viene caricato nella tabella Eventi di elaborazione dati.
  • L'agente segnala a sé stesso che è stato importato un nuovo documento.
  • Viene visualizzato il prompt di estrazione per fornire un'anteprima di ciò che viene esportato nel riquadro della chat.
  • Il documento viene elaborato come descritto in questo flusso, a partire dal passaggio 2.

Flusso di lavoro di configurazione

L'agente necessita di diverse configurazioni per funzionare in modo autonomo. Per semplificare le cose, è disponibile un'esperienza di configurazione completa. Ecco i passaggi necessari:

  1. Installa l'agente di elaborazione documenti in Copilot Studio. La soluzione dell'agente ha:
    • Una tabella di configurazione dell'elaborazione documenti.
    • Un'app canvas della stazione di convalida per il monitoraggio.
    • Riferimenti a una connessione utilizzati dall'agente (Dataverse, Copilot Studio, PowerApps for Admins).
    • Riferimenti a una connessione utilizzati dai trigger che avviano il flusso di lavoro dell'agente (Outlook, SharePoint).
    • Variabili di ambiente utilizzate dai trigger.
  2. Avvia la procedura guidata di configurazione dell'agente. Questo è l'ultimo passaggio della procedura guidata di installazione Copilot Studio. Ti guida attraverso questo flusso:
    1. Carica un documento di esempio.
    2. Il sistema invia il documento caricato al prompt di estrazione dell'agente.
    3. Vengono visualizzati il contenuto estratto e il tipo di documento. Seleziona quali parti dei dati estratti desideri esportare nel sistema. In questo modo viene creato uno schema che viene memorizzato nella tabella Configurazione elaborazione documenti e utilizzato durante l'azione di esportazione del documento. Puoi accedere alla modalità avanzata per modificare il prompt IA utilizzato nell'azione di estrazione del documento e personalizzarlo.
    4. Definisci le regole di convalida utilizzando un'interfaccia utente semplice che aggiunge regole al prompt utilizzato nell'azione di convalida del documento. Puoi anche accedere alla modalità avanzata per modificare direttamente il prompt IA.
    5. Quando richiesto, inserisci l'indirizzo e-mail dell'amministratore dell'agente. Viene utilizzato nell'azione di revisione manuale durante la creazione della richiesta di approvazione. Puoi anche aggiungere un messaggio personalizzato per il responsabile dell'approvazione. Queste informazioni vengono salvate nelle variabili di ambiente fornite con la soluzione.
    6. Seleziona un'origine documento da un elenco. Questi trigger avviano il flusso di elaborazione documenti e solitamente necessitano di un riferimento a una connessione e di alcune variabili di ambiente (come il nome della casella di posta o l'indirizzo della cartella), a seconda dell'origine del documento selezionata.
    7. Completa la configurazione. In questo modo viene creata una tabella Dataverse nel sistema con le colonne selezionate in precedenza e in questa tabella viene esportato il documento utilizzato nella procedura guidata.

Componenti

Ecco i componenti chiave coinvolti nella creazione e nell'implementazione di un agente autonomo per l'elaborazione documenti in Copilot Studio.

  • Copilot Studio fa parte di soluzioni di Microsoft Power Platform senza codice o con uso limitato di codice. Copilot Studio è uno strumento grafico a basso codice per la creazione di un agente, inclusa l'automazione degli edifici con flussi agente e per l'estensione di Microsoft 365 Copilot con dati e scenari aziendali.
  • Power Apps fa parte di soluzioni di Microsoft Power Platform senza codice o con uso limitato di codice. Power Apps è una suite di app, servizi, connettori e una piattaforma dati che offre un ambiente di sviluppo rapido per la creazione di app personalizzate per le esigenze aziendali. Con Power Apps, è possibile compilare rapidamente app aziendali personalizzate che si connettono ai dati aziendali archiviati o nella piattaforma di dati sottostante (Microsoft Dataverse) o in diverse origini dati online e locali come SharePoint, Microsoft 365, Dynamics 365 e SQL Server.
  • Dataverse è un database operativo per scenari multi-agente. Offre agli agenti una piattaforma sicura e scalabile per archiviare dati di stato, cronologia e dati di conversazione. Questa archiviazione centralizzata consente agli agenti di interagire e condividere dati, in modo che possano eseguire le attività in modo autonomo o semi-autonomo. Dataverse consente inoltre agli agenti di connettersi e aggiornare i dati aziendali in diverse app aziendali, come i sistemi CRM, in modo che i dati rimangano coerenti e aggiornati in tutta l'organizzazione. Con Dataverse, le organizzazioni gestiscono e governano i flussi di lavoro degli agenti per garantire affidabilità, sicurezza ed eccellenza operativa.

Dettagli dello scenario

Le organizzazioni lavorano con documenti strutturati, come moduli, fatture, ricevute e documenti di identità e con documenti non strutturati, come promemoria, contratti e richieste di feedback dei clienti. Una delle principali sfide che le organizzazioni devono affrontare è l'automazione dell'elaborazione documenti per ottimizzare i processi aziendali. Puoi automatizzare diversi passaggi, tra cui la raccolta, la classificazione, l'estrazione, la convalida, la trasformazione e l'esportazione dei documenti. L'utilizzo di un agente di elaborazione documenti offre numerosi vantaggi rispetto all'elaborazione tradizionale dei documenti. L'agente di elaborazione documenti è una soluzione pronta all'uso, quindi non è necessario effettuare lunghe operazioni di etichettatura dei dati durante la configurazione. La sua progettazione interattiva consente di elaborare grandi volumi di documenti con la supervisione umana.

Considerazioni

Queste considerazioni implementano i pilastri di Power Platform Well-Architected, un insieme di principi guida che migliorano la qualità di un carico di lavoro. Altre informazioni in Microsoft Power Platform Well-Architected.

Affidabilità

L'agente di elaborazione documenti è progettato per garantire resilienza, ripristino e operazioni mediante componenti Power Platform ospitati in Azure.

Sicurezza

L'agente di elaborazione documenti è progettato per proteggere la riservatezza, l'integrità e la disponibilità dei dati mediante componenti Power Platform ospitati in Azure. I documenti importati nella tabella Eventi di elaborazione dati sono visibili solo agli amministratori di sistema. Non vengono memorizzati dati aggiuntivi, come il corpo o l'oggetto dell'e-mail, oltre ai documenti allegati Dataverse. Tutte le informazioni relative al cliente associate a un documento vengono archiviate nella colonna Dati elaborati della tabella Eventi di elaborazione dati. È possibile gestire le richieste GDPR interrogando questa colonna.

Eccellenza operativa

L'agente di elaborazione documenti è progettato per migliorare le operazioni con monitoraggio e informazioni dettagliate, automatizzando per aumentare l'efficienza mediante l'utilizzo di componenti Power Platform ospitati in Azure.

Efficienza prestazionale

L'agente di elaborazione documenti è progettato per ottenere prestazioni ottimali tramite l'utilizzo di componenti Power Platform ospitati in Azure. L'agente di elaborazione documenti supporta l'elaborazione di documenti di dimensioni fino a 20 MB. Secondo il benchmark più recente, l'elaborazione di un singolo documento di 2 MB richiede circa 48 secondi. L'agente è progettato per sostenere questa durata di elaborazione per oltre 1.000 documenti, a condizione che la fonte del documento selezionato disponga di spazio di archiviazione sufficiente. Per altre quote e limitazioni, vedi Limiti - Power Automate.

Ottimizzazione dell'esperienza

L'agente di elaborazione documenti è progettato per gli utenti che elaborano documenti, garantendo semplicità ed efficienza mediante l'uso di componenti Power Platform. L'agente fornisce un'esperienza configurabile per aggiungere fonti di documenti e consente l'estendibilità per aggiungere ulteriori fonti di documenti.

IA responsabile

L'agente di elaborazione documenti è progettato per raggiungere standard di intelligenza artificiale responsabili utilizzando componenti Power Platform tra cui Copilot Studio progettati per funzionalità di intelligenza artificiale generativa. ALtre informazioni: Domande frequenti sull'intelligenza artificiale responsabile per Copilot Studio.

Contributori

Microsoft mantiene questo articolo. I seguenti collaboratori hanno scritto questo articolo.

Autori principali:

Passaggi successivi

  • Migliora il flusso di configurazione per consentire agli utenti di personalizzare la propria esperienza di esportazione. Ad esempio, aggiungi connettori Power Platform predefiniti per esportare in sistemi come SAP o Salesforce e consenti agli utenti di personalizzare lo schema in modo che si adatti alle voci delle tabelle SAP o Salesforce.
  • Migliora il flusso di configurazione per consentire agli utenti di connettersi a più origini di documenti contemporaneamente, come Outlook e SharePoint.
  • Consenti all'agente di gestire più tipi di documenti contemporaneamente modificando dinamicamente lo schema utilizzato nell'esportazione in base al tipo di documento.