Guida rapida: esegui il deployment del prompt di Vertex AI Studio come applicazione web

In Vertex AI Studio, puoi progettare e eseguire l'iterazione dei prompt e confrontare i risultati di configurazioni e modelli diversi. Una volta completata la progettazione del prompt, puoi eseguirlo come applicazione web da condividere con i tuoi collaboratori o con gli utenti di destinazione per consentirgli di testare l'applicazione web. L'applicazione web è ospitata su Cloud Run ed è disponibile al di fuori della Google Cloud console.

In questa guida rapida, imparerai a:

  • Creare un prompt con variabili del prompt
  • Esegui il deployment del prompt come applicazione web
  • Monitora l'avanzamento del deployment e testa l'applicazione di cui è stato eseguito il deployment
  • Aggiorna ed esegui nuovamente il deployment del prompt
  • Provare l'invio di prompt con i supporti multimodali

Prima di iniziare

Se non hai mai utilizzato Vertex AI Studio, puoi seguire un'altra guida introduttiva o seguire il corso Google Cloud Skills Boost per apprendere le nozioni di base di Vertex AI Studio. Per questa guida, devi disporre di quanto segue:

  1. Un progetto Google Cloud creato con la fatturazione abilitata
  2. API Vertex AI abilitata

Sono richieste autorizzazioni aggiuntive

Oltre alle autorizzazioni esistenti per l'utilizzo di Vertex AI Studio, per eseguire il deployment del prompt devi disporre delle seguenti autorizzazioni:

Azione Autorizzazioni obbligatorie Finalità
Abilita API aggiuntive serviceusage.services.enable Abilita le seguenti API:
  • API Cloud Run Admin (run.googleapis.com)
  • API Artifact Registry (artifactregistry.googleapis.com)
  • API Cloud Build (cloudbuild.googleapis.com)
  • API Cloud Logging (logging.googleapis.com)
Concedi le autorizzazioni ai service account resourcemanager.projects.setIamPolicy Concedi al service account predefinito di Compute Engine i seguenti ruoli:
Esegui il deployment di autorizzazioni specifiche
  • storage.buckets.create
  • run.services.create
  • artifactregistry.repositories.create
  • run.services.setIamPolicy
Durante il deployment, un insieme di codici sorgente verrà caricato su Cloud Storage e poi di nuovo su Cloud Run con la creazione di un nuovo servizio. artifactregistry.repositories.create è necessario per creare un repository per l'immagine del container. run.services.setIamPolicy è necessario per rendere il servizio accessibile pubblicamente.

Se sei il proprietario del progetto, non devi intraprendere ulteriori azioni, ma seguire le guide in Vertex AI Studio. Se non sei il proprietario del progetto, chiedi all'amministratore del progetto di eseguire le prime due azioni e poi di concederti i ruoli Editor (roles/editor) e Amministratore Cloud Run (roles/run.admin).

Creare un prompt con variabili del prompt

Vai alla pagina di creazione del prompt di Vertex AI Studio, poi fai clic su Aggiungi variabile nella casella di immissione del prompt.

Nella finestra di dialogo Gestisci variabili del prompt, inserisci un nome di variabile e assegnale un valore. Poi fai clic su Applica.

Gestisci variabili del prompt
dialog

Nella casella di immissione del prompt, componi il prompt utilizzando la variabile e poi modifica gli altri parametri. Ad esempio, puoi attivare Connessione a terra con la Rete di ricerca di Google e avere "Ricevi sempre il meteo aggiornato dal web" come istruzioni di sistema.

Esegui il deployment del prompt come applicazione web

Per eseguire il deployment del prompt come applicazione web, fai clic sul pulsante Compila con codice nell'angolo in alto a destra. Poi fai clic su Esegui il deployment come app.

Fai clic sul pulsante Crea con codice e poi su Esegui deployment come app

Salva il prompt

Viene visualizzata la finestra di dialogo del prompt di salvataggio, poiché il salvataggio è necessario prima di poter eseguire il deployment di un prompt. La finestra di dialogo di deployment si aprirà automaticamente dopo aver salvato il prompt.

Salva il prompt prima di eseguire il deployment.

Attiva le API per il primo deployment e concedi le autorizzazioni

Una volta salvato il prompt, il processo di deployment continuerà. Se si tratta del tuo primo deployment, verrà visualizzata una finestra di dialogo per l'abilitazione delle API richieste. Fai clic su Abilita le API richieste.

Una volta attivate le API, viene visualizzata la finestra di dialogo Crea un'app web. Poiché si tratta di una funzionalità di anteprima pubblica, controllo dell'accesso non è supportato. Pertanto, tutte le applicazioni di cui è stato eseguito il deployment consentiranno l'accesso pubblico. Non includere nel prompt informazioni sensibili o che consentono l'identificazione personale (PII).

Seleziona la casella di controllo Sono consapevole che il deployment di questa app sarà eseguito pubblicamente, quindi fai clic su Crea app.

Se è il tuo primo deployment, verrà visualizzata un'altra finestra di dialogo che ti chiede di concedere i ruoli richiesti all'account di servizio. Fai clic su Concedi tutto per continuare.

Il deployment inizia

Vertex AI Studio creerà un file ZIP contenente il codice sorgente dell'applicazione web e lo caricherà in un bucket Cloud Storage. Dopo l'avvio del deployment, viene visualizzata la finestra di dialogo Gestisci app web con informazioni sul deployment, ad esempio il nome dell'applicazione, la data dell'ultimo deployment, lo stato del deployment e altro ancora.

Finestra di dialogo Gestisci app

Monitoraggio dello stato del deployment

Il deployment richiede 2-3 minuti e lo stato del deployment viene visualizzato nella colonna Stato della finestra di dialogo Gestisci app web. Se chiudi la finestra di dialogo Gestisci app web, puoi riaprirla dal menu sotto il pulsante Crea con il codice.

Al termine del deployment, la colonna dello stato diventa Pronto e accanto al nome dell'applicazione viene visualizzato il pulsante Apri.

Il pulsante Apri l'app viene visualizzato accanto al nome
dell'app

Controllo dell'accesso e chiave segreta

Il deployment dell'applicazione web viene eseguito con controllo dell'accesso Consenti non autenticato attivo per impostazione predefinita. Puoi disattivarla facendo clic sul pulsante con l'icona a forma di matita. Per maggiori informazioni, consulta la sezione relativa alla disattivazione dell'accesso pubblico.

Per fornire una protezione di base, l'applicazione web richiede che una chiave segreta venga aggiunta all'URL per l'invio della richiesta. Puoi trovare la chiave segreta nella colonna Chiave segreta. Se apri l'applicazione web da Vertex AI Studio, la chiave verrà aggiunta all'URL per te.

Apri l'applicazione web e invia il prompt

Fai clic su Apri nella finestra di dialogo Gestisci app web per accedere all'applicazione di cui è stato eseguito il deployment. L'applicazione deve essere aperta con la chiave segreta aggiunta all'URL nel formato di ?key=SECRET_KEY.

Apri l'applicazione web dalla finestra di dialogo Gestisci app. La chiave segreta viene aggiunta all'URL.

Inserisci un valore nella variabile e fai clic su Invia. Dovresti riuscire a vedere i risultati sulla destra.

Invia il prompt dall'app web

Apri l'applicazione web dal menu del pulsante Crea con il codice

Se la tua applicazione web è pronta, puoi aprirla anche dal menu del pulsante Crea con il codice.

Apri l'app dal menu del pulsante
Crea con il codice

Cloud Run è un servizio serverless, il che significa che il contenitore per l'applicazione verrà arrestato se non viene utilizzato attivamente. Pertanto, a volte il caricamento dell'applicazione web può richiedere alcuni secondi o un invio non funzionerà se l'applicazione web è rimasta inattiva per troppo tempo. L'aggiornamento della pagina dovrebbe risolvere il problema.

Monitoraggio dello stato dalla campanella di notifica

Puoi anche monitorare lo stato dal menu Notifiche facendo clic sull'icona della campana. L'icona a forma di campana interromperà l'animazione di caricamento e mostrerà un cerchio verde se il deployment è stato completato correttamente.

Monitorare lo stato dalla campanella di notifica

Se fai clic sulla notifica, ti reindirizzeremo alla pagina Cloud Run. All'URL nella pagina Cloud Run non è stata aggiunta la chiave segreta. Dovrai aggiungerlo manualmente nel formato ?key=SECRET_KEY.

Al link dell'app nella pagina Cloud Run non è stata aggiunta la chiave

Aggiorna ed esegui nuovamente il deployment del prompt

Puoi modificare ulteriormente il prompt in Vertex AI Studio e trasformarlo in una conversazione. Poi fai clic sul pulsante Crea con codice e su Gestisci app per aprire la finestra di dialogo Gestisci app web. Fai clic su Aggiorna app per eseguire nuovamente il deployment dell'applicazione web con il prompt aggiornato.

Viene visualizzata una finestra di dialogo di conferma. Ti informa che, se esegui il nuovo deployment, perderai tutte le modifiche apportate all'applicazione web di cui è stato eseguito il deployment al di fuori di Vertex AI Studio (ad esempio nell'editor di codice sorgente Cloud Run). Fai clic su Conferma per procedere.

Viene visualizzata di nuovo la finestra di dialogo Gestisci app web. La procedura è simile al deployment iniziale. Puoi monitorare l'avanzamento come per il primo deployment.

Al termine dell'aggiornamento, puoi riaprire l'applicazione web. Vedrai l'interfaccia utente della conversazione con la variabile prompt. Inserisci il valore e digita contenuti non vuoti per continuare la conversazione.

L'app aggiornata ha un'interfaccia utente chat

Inserire contenuti multimodali

Puoi inserire input come immagini, video, audio e documenti nell'UI della conversazione. Gli input supportati dipendono dal modello selezionato per il prompt. Consulta la documentazione relativa al supporto multimodale per ogni modello.

Per inserire un file, fai clic sul pulsante con l'icona a forma di clip nella casella di immissione della conversazione.

Inserire input multimodali

Potrai interagire con il modello con i dati che fornisci.

Interagire con il modello utilizzando gli input multimodali

Argomenti avanzati

Una volta acquisita familiarità con la procedura di deployment, puoi prendere in considerazione le seguenti azioni.

Modificare il codice sorgente in Cloud Run

Se vuoi personalizzare l'applicazione web, puoi apportare modifiche al codice sorgente in Cloud Run. Apri la pagina del codice sorgente di Cloud Run dalla finestra di dialogo Gestisci app web facendo clic sul pulsante dell'icona Altro alla fine della riga. editor di codice open source dalla finestra di dialogo di gestione dell'app web

In alternativa, puoi accedere alla pagina Sicurezza anche dall'applicazione web facendo clic sul link Editor di codice sorgente.

Nella pagina del codice sorgente di Cloud Run, fai clic su Modifica codice sorgente per avviare la modalità di modifica. Al termine, fai clic su Salva e ridistribuisci.

Al termine del nuovo dispiegamento, devi aprire l'applicazione da Vertex AI Studio. Puoi accedere alla pagina Vertex AI Studio dal link nel badge Deployment eseguito da Vertex AI.

Disattivare l'accesso pubblico

Se non è necessario che l'applicazione web sia accessibile pubblicamente, puoi disattivarla in Cloud Run. Apri la finestra di dialogo Gestisci app web e fai clic sull'icona a forma di matita nella colonna Controllo accesso. La pagina Sicurezza di Cloud Run si aprirà in una nuova scheda.

Puoi anche accedere alla pagina Sicurezza dall'applicazione web facendo clic sul link Impostazioni di sicurezza.

Nella pagina Sicurezza del servizio Cloud Run corrispondente della tua applicazione web, seleziona Utilizza Cloud IAM per autenticare le richieste in entrata e scegli Richiedi autenticazione. Fai clic su Salva.

Di conseguenza, la tua applicazione web non sarà più accessibile tramite l'URL. Se provi ad accedere, visualizzerai la pagina Error: Forbidden (Errore: accesso vietato).

Riattivare l'accesso pubblico

Se vuoi ripristinare l'accesso pubblico, deseleziona la casella di controllo Utilizza Cloud IAM per autenticare le richieste in entrata e salva. Se scegli Consenti chiamate non autenticate, l'opzione non funzionerà se il progetto fa parte di un'organizzazione. Per ulteriori dettagli, consulta l'autenticazione in Cloud Run.

Configurare l'accesso locale per lo sviluppo

In Anteprima pubblica, il controllo dell'accesso non è ancora supportato. Pertanto, una volta disattivato l'accesso pubblico, l'unico modo per accedere all'applicazione web è configurare un proxy locale. Puoi farlo tramite i comandi gcloud. Innanzitutto, apri Cloud Shell tramite il pulsante icona del terminale nell'angolo in alto a destra della Google Cloud console. Ti verrà chiesto di autorizzare Cloud Shell. Fai clic su Autorizza per continuare.

Al termine, apri la finestra di dialogo Gestisci app web e fai clic sul pulsante icona Altro alla fine della riga per visualizzare altre azioni. Fai clic su Configura l'accesso locale tramite Cloud Shell. Ottenere il comando di configurazione dell'accesso locale dalla finestra di dialogo di gestione dell'app web

A Cloud Shell verrà aggiunto un comando. Premi Invio e attendi il completamento della stampa. Fai clic sul link nella riga che inizia con Click on the link to preview. Potrai visualizzare la tua richiesta. Questo link funziona solo quando il comando gcloud è in esecuzione. Link per l'accesso locale in Cloud Shell

Problemi comuni

Errore di autenticazione: nessuna chiave segreta

Se visualizzi il seguente errore, significa che non è stata aggiunta alcuna chiave secret all'URL. Segui le istruzioni per aprire l'applicazione web da Vertex AI Studio oppure copia la chiave segreta dalla finestra di dialogo Gestisci app e aggiungila all'URL nel formato di ?key=SECRET_KEY.

errore per nessuna chiave segreta

Errore di autenticazione: chiave segreta non valida

Il seguente errore indica che la chiave aggiunta all'URL non è valida. La chiave segreta è univoca per ogni prompt. Se hai una chiave segreta di un altro prompt, non funzionerà. Segui le istruzioni per aprire correttamente l'applicazione web.

errore per chiave non valida

400 Argomento non valido: input vuoto

Il seguente errore si verifica quando sono presenti input nella variabile prompt, ma la chat è vuota. Viene visualizzato un messaggio di errore 400. Per risolvere il problema, digita un valore non vuoto e invia nuovamente.

errore per contenuti vuoti

400 Argomento non valido: il tipo mime non è supportato

Se scegli un tipo di file non supportato dal modello, verrà restituito un errore 400. Questo è normale e dovrai utilizzare altri tipi di file supportati dal modello. Consulta la documentazione per il supporto multimodale di ciascun modello.

errore per tipi MIME non supportati

Passaggi successivi