In Vertex AI Studio, puoi progettare e eseguire l'iterazione dei prompt e confrontare i risultati di configurazioni e modelli diversi. Una volta completata la progettazione del prompt, puoi eseguirlo come applicazione web da condividere con i tuoi collaboratori o con gli utenti di destinazione per consentirgli di testare l'applicazione web. L'applicazione web è ospitata su Cloud Run ed è disponibile al di fuori della Google Cloud console.
In questa guida rapida, imparerai a:
- Creare un prompt con variabili del prompt
- Esegui il deployment del prompt come applicazione web
- Monitora l'avanzamento del deployment e testa l'applicazione di cui è stato eseguito il deployment
- Aggiorna ed esegui nuovamente il deployment del prompt
- Provare l'invio di prompt con i supporti multimodali
Prima di iniziare
Se non hai mai utilizzato Vertex AI Studio, puoi seguire un'altra guida introduttiva o seguire il corso Google Cloud Skills Boost per apprendere le nozioni di base di Vertex AI Studio. Per questa guida, devi disporre di quanto segue:
- Un progetto Google Cloud creato con la fatturazione abilitata
- API Vertex AI abilitata
Sono richieste autorizzazioni aggiuntive
Oltre alle autorizzazioni esistenti per l'utilizzo di Vertex AI Studio, per eseguire il deployment del prompt devi disporre delle seguenti autorizzazioni:
Azione | Autorizzazioni obbligatorie | Finalità |
---|---|---|
Abilita API aggiuntive | serviceusage.services.enable |
Abilita le seguenti API:
|
Concedi le autorizzazioni ai service account | resourcemanager.projects.setIamPolicy |
Concedi al
service account predefinito di Compute Engine i seguenti ruoli:
|
Esegui il deployment di autorizzazioni specifiche |
|
Durante il deployment, un insieme di codici sorgente verrà caricato su Cloud Storage e poi di nuovo su Cloud Run con la creazione di un nuovo servizio. artifactregistry.repositories.create
è necessario per creare un repository per l'immagine del container.
run.services.setIamPolicy è necessario per rendere il servizio accessibile pubblicamente.
|
Se sei il proprietario del progetto, non devi intraprendere ulteriori azioni, ma seguire le guide in Vertex AI Studio. Se non sei il
proprietario del progetto, chiedi all'amministratore del progetto di eseguire le prime due
azioni e poi di concederti i ruoli
Editor (roles/editor
) e
Amministratore Cloud Run
(roles/run.admin
).
Creare un prompt con variabili del prompt
Vai alla pagina di creazione del prompt di Vertex AI Studio, poi fai clic su Aggiungi variabile nella casella di immissione del prompt.
Nella finestra di dialogo Gestisci variabili del prompt, inserisci un nome di variabile e assegnale un valore. Poi fai clic su Applica.
Nella casella di immissione del prompt, componi il prompt utilizzando la variabile e poi modifica gli altri parametri. Ad esempio, puoi attivare Connessione a terra con la Rete di ricerca di Google e avere "Ricevi sempre il meteo aggiornato dal web" come istruzioni di sistema.
Esegui il deployment del prompt come applicazione web
Per eseguire il deployment del prompt come applicazione web, fai clic sul pulsante Compila con codice nell'angolo in alto a destra. Poi fai clic su Esegui il deployment come app.
Salva il prompt
Viene visualizzata la finestra di dialogo del prompt di salvataggio, poiché il salvataggio è necessario prima di poter eseguire il deployment di un prompt. La finestra di dialogo di deployment si aprirà automaticamente dopo aver salvato il prompt.
Attiva le API per il primo deployment e concedi le autorizzazioni
Una volta salvato il prompt, il processo di deployment continuerà. Se si tratta del tuo primo deployment, verrà visualizzata una finestra di dialogo per l'abilitazione delle API richieste. Fai clic su Abilita le API richieste.
Una volta attivate le API, viene visualizzata la finestra di dialogo Crea un'app web. Poiché si tratta di una funzionalità di anteprima pubblica, controllo dell'accesso non è supportato. Pertanto, tutte le applicazioni di cui è stato eseguito il deployment consentiranno l'accesso pubblico. Non includere nel prompt informazioni sensibili o che consentono l'identificazione personale (PII).
Seleziona la casella di controllo Sono consapevole che il deployment di questa app sarà eseguito pubblicamente, quindi fai clic su Crea app.
Se è il tuo primo deployment, verrà visualizzata un'altra finestra di dialogo che ti chiede di concedere i ruoli richiesti all'account di servizio. Fai clic su Concedi tutto per continuare.
Il deployment inizia
Vertex AI Studio creerà un file ZIP contenente il codice sorgente dell'applicazione web e lo caricherà in un bucket Cloud Storage. Dopo l'avvio del deployment, viene visualizzata la finestra di dialogo Gestisci app web con informazioni sul deployment, ad esempio il nome dell'applicazione, la data dell'ultimo deployment, lo stato del deployment e altro ancora.
Monitoraggio dello stato del deployment
Il deployment richiede 2-3 minuti e lo stato del deployment viene visualizzato nella colonna Stato della finestra di dialogo Gestisci app web. Se chiudi la finestra di dialogo Gestisci app web, puoi riaprirla dal menu sotto il pulsante Crea con il codice.
Al termine del deployment, la colonna dello stato diventa Pronto e accanto al nome dell'applicazione viene visualizzato il pulsante Apri.
Controllo dell'accesso e chiave segreta
Il deployment dell'applicazione web viene eseguito con controllo dell'accesso Consenti non autenticato attivo per impostazione predefinita. Puoi disattivarla facendo clic sul pulsante sezione relativa alla disattivazione dell'accesso pubblico.
con l'icona a forma di matita. Per maggiori informazioni, consulta laPer fornire una protezione di base, l'applicazione web richiede che una chiave segreta venga aggiunta all'URL per l'invio della richiesta. Puoi trovare la chiave segreta nella colonna Chiave segreta. Se apri l'applicazione web da Vertex AI Studio, la chiave verrà aggiunta all'URL per te.
Apri l'applicazione web e invia il prompt
Fai clic su Apri nella finestra di dialogo Gestisci app web per accedere all'applicazione di cui è stato eseguito il deployment. L'applicazione deve essere aperta con la chiave segreta aggiunta all'URL nel formato di ?key=SECRET_KEY
.
Inserisci un valore nella variabile e fai clic su Invia. Dovresti riuscire a vedere i risultati sulla destra.
Apri l'applicazione web dal menu del pulsante Crea con il codice
Se la tua applicazione web è pronta, puoi aprirla anche dal menu del pulsante Crea con il codice.
Cloud Run è un servizio serverless, il che significa che il contenitore per l'applicazione verrà arrestato se non viene utilizzato attivamente. Pertanto, a volte il caricamento dell'applicazione web può richiedere alcuni secondi o un invio non funzionerà se l'applicazione web è rimasta inattiva per troppo tempo. L'aggiornamento della pagina dovrebbe risolvere il problema.
Monitoraggio dello stato dalla campanella di notifica
Puoi anche monitorare lo stato dal menu Notifiche facendo clic sull'icona della campana. L'icona a forma di campana interromperà l'animazione di caricamento e mostrerà un cerchio verde se il deployment è stato completato correttamente.
Se fai clic sulla notifica, ti reindirizzeremo alla pagina Cloud Run. All'URL nella pagina Cloud Run non è stata aggiunta la chiave segreta. Dovrai aggiungerlo manualmente nel formato ?key=SECRET_KEY
.
Aggiorna ed esegui nuovamente il deployment del prompt
Puoi modificare ulteriormente il prompt in Vertex AI Studio e trasformarlo in una conversazione. Poi fai clic sul pulsante Crea con codice e su Gestisci app per aprire la finestra di dialogo Gestisci app web. Fai clic su Aggiorna app per eseguire nuovamente il deployment dell'applicazione web con il prompt aggiornato.
Viene visualizzata una finestra di dialogo di conferma. Ti informa che, se esegui il nuovo deployment, perderai tutte le modifiche apportate all'applicazione web di cui è stato eseguito il deployment al di fuori di Vertex AI Studio (ad esempio nell'editor di codice sorgente Cloud Run). Fai clic su Conferma per procedere.
Viene visualizzata di nuovo la finestra di dialogo Gestisci app web. La procedura è simile al deployment iniziale. Puoi monitorare l'avanzamento come per il primo deployment.
Al termine dell'aggiornamento, puoi riaprire l'applicazione web. Vedrai l'interfaccia utente della conversazione con la variabile prompt. Inserisci il valore e digita contenuti non vuoti per continuare la conversazione.
Inserire contenuti multimodali
Puoi inserire input come immagini, video, audio e documenti nell'UI della conversazione. Gli input supportati dipendono dal modello selezionato per il prompt. Consulta la documentazione relativa al supporto multimodale per ogni modello.
Per inserire un file, fai clic sul pulsante con l'icona a forma di clip nella casella di immissione della conversazione.
Potrai interagire con il modello con i dati che fornisci.
Argomenti avanzati
Una volta acquisita familiarità con la procedura di deployment, puoi prendere in considerazione le seguenti azioni.
Modificare il codice sorgente in Cloud Run
Se vuoi personalizzare l'applicazione web, puoi apportare modifiche al codice sorgente in Cloud Run. Apri la pagina del codice sorgente di Cloud Run dalla finestra di dialogo Gestisci app web facendo clic sul pulsante dell'icona Altro
In alternativa, puoi accedere alla pagina Sicurezza anche dall'applicazione web facendo clic sul link Editor di codice sorgente.
Nella pagina del codice sorgente di Cloud Run, fai clic su Modifica codice sorgente per avviare la modalità di modifica. Al termine, fai clic su Salva e ridistribuisci.
Al termine del nuovo dispiegamento, devi aprire l'applicazione da Vertex AI Studio. Puoi accedere alla pagina Vertex AI Studio dal link nel badge Deployment eseguito da Vertex AI.
Disattivare l'accesso pubblico
Se non è necessario che l'applicazione web sia accessibile pubblicamente, puoi disattivarla in Cloud Run. Apri la finestra di dialogo Gestisci app web e fai clic sull'icona a forma di matita
nella colonna Controllo accesso. La pagina Sicurezza di Cloud Run si aprirà in una nuova scheda.Puoi anche accedere alla pagina Sicurezza dall'applicazione web facendo clic sul link Impostazioni di sicurezza.
Nella pagina Sicurezza del servizio Cloud Run corrispondente della tua applicazione web, seleziona Utilizza Cloud IAM per autenticare le richieste in entrata e scegli Richiedi autenticazione. Fai clic su Salva.
Di conseguenza, la tua applicazione web non sarà più accessibile tramite l'URL. Se provi ad accedere, visualizzerai la pagina Error: Forbidden (Errore: accesso vietato).
Riattivare l'accesso pubblico
Se vuoi ripristinare l'accesso pubblico, deseleziona la casella di controllo Utilizza Cloud IAM per autenticare le richieste in entrata e salva. Se scegli Consenti chiamate non autenticate, l'opzione non funzionerà se il progetto fa parte di un'organizzazione. Per ulteriori dettagli, consulta l'autenticazione in Cloud Run.
Configurare l'accesso locale per lo sviluppo
In Anteprima pubblica, il controllo dell'accesso non è ancora supportato. Pertanto, una volta disattivato l'accesso pubblico, l'unico modo per accedere all'applicazione web è configurare un proxy locale. Puoi farlo tramite i comandi gcloud. Innanzitutto, apri Cloud Shell tramite il pulsante
icona del terminale nell'angolo in alto a destra della Google Cloud console. Ti verrà chiesto di autorizzare Cloud Shell. Fai clic su Autorizza per continuare.
Al termine, apri la finestra di dialogo Gestisci app web e fai clic sul pulsante
A Cloud Shell verrà aggiunto un comando. Premi Invio e attendi il completamento della stampa. Fai clic sul link nella riga che inizia con Click on the
link to preview
. Potrai visualizzare la tua richiesta. Questo link
funziona solo quando il comando gcloud è in esecuzione.
Problemi comuni
Errore di autenticazione: nessuna chiave segreta
Se visualizzi il seguente errore, significa che non è stata aggiunta alcuna chiave secret all'URL. Segui le istruzioni per aprire l'applicazione web da Vertex AI Studio oppure copia la chiave segreta dalla finestra di dialogo Gestisci app e aggiungila all'URL nel formato di ?key=SECRET_KEY
.

Errore di autenticazione: chiave segreta non valida
Il seguente errore indica che la chiave aggiunta all'URL non è valida. La chiave segreta è univoca per ogni prompt. Se hai una chiave segreta di un altro prompt, non funzionerà. Segui le istruzioni per aprire correttamente l'applicazione web.

400 Argomento non valido: input vuoto
Il seguente errore si verifica quando sono presenti input nella variabile prompt, ma la chat è vuota. Viene visualizzato un messaggio di errore 400. Per risolvere il problema, digita un valore non vuoto e invia nuovamente.

400 Argomento non valido: il tipo mime non è supportato
Se scegli un tipo di file non supportato dal modello, verrà restituito un errore 400. Questo è normale e dovrai utilizzare altri tipi di file supportati dal modello. Consulta la documentazione per il supporto multimodale di ciascun modello.

Passaggi successivi
Scopri altre funzionalità di Vertex AI Studio nella documentazione o nel corso Introduzione a Vertex AI Studio Google Cloud Skills Boost.
Consulta i prezzi di Cloud Run.
Consulta la sezione sull'autenticazione in Cloud Run.