En este documento, se describe cómo crear un grupo de instancias administrado (MIG) con instancias de máquina virtual (VM) que tengan GPU conectadas. En él, se describe cómo agregar VMs con GPU de una sola vez en un MIG zonal con solicitudes de cambio de tamaño y el modelo de aprovisionamiento de inicio flexible. Para crear una solicitud de cambio de tamaño de MIG que pueda usar las funciones y los servicios disponibles en el Director de clústeres, consulta Cómo crear un MIG y una solicitud de cambio de tamaño en la documentación de Hypercomputer de IA.
El uso de una solicitud de cambio de tamaño de MIG con el modelo de aprovisionamiento de inicio flexible mejora la disponibilidad de las VMs de GPU. En la solicitud, especifica la cantidad de VMs de GPU y la duración para la que deseas ejecutar esas VMs. El programador dinámico de cargas de trabajo (DWS), el mecanismo de programador subyacente, programa las solicitudes de cambio de tamaño creadas en Compute Engine según las duraciones solicitadas y la disponibilidad de recursos. Cuando los recursos estén disponibles, el MIG creará automáticamente las VMs.
Si el trabajo que se ejecuta en estas VMs finaliza antes de la duración solicitada, puedes borrar esas VMs. De lo contrario, el MIG borra de forma automática las VMs al final de la duración de ejecución.
También puedes leer sobre otras situaciones básicas para crear un MIG.
Antes de comenzar
- A fin de asegurarte de que tienes suficiente cuota de GPU para los recursos que solicitas, verifica tu cuota de GPU.
- Para comprender el consumo de cuotas, lee VMs de GPU y cuotas de asignación interrumpibles.
-
Si aún no lo hiciste, configura la autenticación.
La autenticación es el proceso mediante el cual se verifica tu identidad para acceder a los servicios y las APIs de Google Cloud .
Para ejecutar código o muestras desde un entorno de desarrollo local, puedes autenticarte en Compute Engine seleccionando una de las siguientes opciones:
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
-
After installing the Google Cloud CLI, initialize it by running the following command:
gcloud init
If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
- Set a default region and zone.
Crea una plantilla de instancias, que es necesaria para crear un MIG. El MIG crea cada VM del grupo según la plantilla de instancias. En la plantilla, especifica la configuración para las VMs de GPU y las opciones de configuración adicionales necesarias a fin de usar solicitudes de cambio de tamaño.
Para obtener más información sobre las plantillas de instancias, consulta Acerca de las plantillas de instancias.
Crea un MIG y una solicitud de cambio de tamaño para agregar VMs de GPU de una sola vez.
Ve a la página Plantillas de instancias.
Haz clic en Crear plantilla de instancias. Se abrirá la página Crear una plantilla de instancias.
En el campo Nombre, ingresa un nombre para la plantilla de instancias.
En la sección Configuración de la máquina, haz lo siguiente:
Haz clic en la pestaña GPU.
En la lista Tipo de GPU, selecciona el tipo de GPU.
En la lista Cantidad de GPU, selecciona la cantidad.
En la sección Tipo de máquina, selecciona un tipo de máquina.
En la sección Modelo de aprovisionamiento, haz lo siguiente:
En la lista Modelo de aprovisionamiento de VM, selecciona Inicio flexible.
Para establecer una duración de ejecución para las VMs creadas a través de la plantilla de instancia, en el campo Ingresar cantidad de horas, ingresa la cantidad de horas. El valor debe estar entre una hora (
1
) y siete días (168
).
Opcional: Para cambiar el valor o la imagen de disco de arranque predeterminados, en la sección Disco de arranque, haz clic en Cambiar. Luego, sigue las instrucciones para cambiar el disco de arranque.
Haz clic en Crear.
INSTANCE_TEMPLATE_NAME
: el nombre de la plantilla de instancias.IMAGE_PROJECT
: el proyecto de imagen que contiene la imagen; por ejemplo,debian-cloud
. Para obtener más información sobre los proyectos de imágenes compatibles, consulta Imágenes públicas.IMAGE_FAMILY
: Es una familia de imágenes. Esto especifica la imagen de SO no obsoleta más reciente. Por ejemplo, si especificasdebian-12
, se usa la versión más reciente de la familia de imágenes de Debian 12. Para obtener más información sobre el uso de las familias de imágenes, consulta Prácticas recomendadas para las familias de imágenes.REGION
: Es la región en la que se creará la plantilla de instancias.MACHINE_TYPE
: un tipo de máquina que admite GPU. Si especificas un tipo de máquina N1, incluye la marca--accelerator
para especificar la cantidad y el tipo de GPU que conectarás a las VMs.RUN_DURATION
: la duración de la que deseas que se ejecuten las VMs. Debes dar formato al valor como la cantidad de días, horas, minutos o segundos, seguidos ded
,h
,m
os
, respectivamente. Por ejemplo, especifica30m
para 30 minutos o1d2h3m4s
para un día, dos horas, tres minutos y cuatro segundos. El valor debe ser de entre 10 minutos y siete días.PROJECT_ID
: Es el ID del proyecto en el que deseas crear la plantilla de instancias.REGION
: Es la región en la que se creará la plantilla de instancias.INSTANCE_TEMPLATE_NAME
: el nombre de la plantilla de instancias.IMAGE_PROJECT
: el proyecto de imagen que contiene la imagen; por ejemplo,debian-cloud
. Para obtener más información sobre los proyectos de imágenes compatibles, consulta Imágenes públicas.IMAGE
: especifica una de las siguientes opciones:una versión específica de la imagen de SO; por ejemplo,
debian-12-bookworm-v20240617
.Una familia de imágenes, que debe tener el formato
family/IMAGE_FAMILY
. Esto especifica la imagen de SO no obsoleta más reciente. Por ejemplo, si especificasfamily/debian-12
, se usa la versión más reciente de la familia de imágenes de Debian 12. Para obtener más información sobre el uso de las familias de imágenes, consulta Prácticas recomendadas para las familias de imágenes.
MACHINE_TYPE
: un tipo de máquina que admite GPU. Si especificas un tipo de máquina N1, incluye el campoguestAccelerators
para especificar la cantidad y el tipo de GPU que conectarás a las VMs.RUN_DURATION
: el tiempo, en segundos, por el que deseas que se ejecuten las VMs solicitadas antes de que el MIG las borre de forma automática. El valor debe estar entre600
, que es 600 segundos (10 minutos), y604800
, que es 604,800 segundos (siete días).Ve a la página Grupos de instancias.
Haz clic en Crear grupo de instancias. Se abrirá la página Crear grupo de instancias.
En el campo Nombre, ingresa un nombre para el MIG.
Antes de seleccionar una plantilla de instancia, debes borrar la configuración del ajuste de escala automático y desactivar las reparaciones de la siguiente manera:
- Para borrar la configuración del ajuste de escala automático, haz lo siguiente:
- En la sección Ajuste de escala automático, haz clic en la lista Modo de ajuste de escala automático y, luego, en Borrar configuración del ajuste de escala automático.
- En el diálogo de confirmación, haz clic en Borrar.
- Para desactivar las reparaciones, en la sección Ciclo de vida de la instancia de VM, haz clic en la lista Acción predeterminada en caso de error y, luego, selecciona Sin acción.
- Para borrar la configuración del ajuste de escala automático, haz lo siguiente:
Regresa al campo Plantilla de instancias. En la lista Plantilla de instancias, selecciona la plantilla de instancias que creaste en la sección anterior.
Realiza una de las siguientes acciones:
- Para crear una solicitud de cambio de tamaño con el MIG, haz lo siguiente:
- En el campo Cantidad de instancias, ingresa la cantidad de VMs que deseas crear a la vez.
- Selecciona la casilla de verificación Usa la solicitud de cambio de tamaño para crear VMs de una sola vez.
- Opcional: Para especificar una duración de ejecución diferente para las VMs que la establecida en la plantilla de instancias, en el campo Duración de ejecución solicitada y las listas Unidad, especifica una duración. La duración debe ser de entre una hora y siete días.
- Para crear una solicitud de cambio de tamaño después de crear el MIG, en el campo
Cantidad de instancias, ingresa
0
.
- Para crear una solicitud de cambio de tamaño con el MIG, haz lo siguiente:
En la sección Ubicación, especifica si deseas crear un MIG regional o zonal de la siguiente manera:
- Para crear un MIG zonal, selecciona Zona única. O bien, para crear un MIG regional, selecciona Varias zonas.
- Selecciona la región y las zonas del MIG.
- Si creas un MIG regional, haz lo siguiente:
- En el campo Forma de distribución objetivo, selecciona Cualquier zona.
- En el cuadro de diálogo que aparece, haz clic en Disable instance redistribution.
Haz clic en Crear.
Crea un MIG zonal con el comando
instance-groups managed create
:gcloud compute instance-groups managed create INSTANCE_GROUP_NAME \ --template=INSTANCE_TEMPLATE_NAME \ --size=0 \ --zone=ZONE \ --default-action-on-vm-failure=do_nothing
En el MIG, crea una solicitud de cambio de tamaño con el comando
instance-groups managed resize-requests create
. Especifica la cantidad de VM de GPU que deseas y la duración de la ejecución de esas VMs.gcloud compute instance-groups managed resize-requests create INSTANCE_GROUP_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --zone=ZONE
INSTANCE_GROUP_NAME
: Es el nombre del MIG.INSTANCE_TEMPLATE_NAME
: Es el nombre de la plantilla de instancias para las VMs con GPU.ZONE
: Una de las zonas disponibles para Compute Engine.RESIZE_REQUEST_NAME
: Es el nombre de la solicitud de cambio de tamaño.COUNT
: la cantidad de VMs que se agregarán a la vez en el grupo.Para crear un MIG zonal, realiza una solicitud
POST
al métodoinstanceGroupManagers.insert
.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers { "versions": [ { "instanceTemplate": "global/instanceTemplates/INSTANCE_TEMPLATE_NAME" } ], "name": "INSTANCE_GROUP_NAME", "targetSize": 0, "instanceLifecyclePolicy": { "defaultActionOnFailure": "DO_NOTHING" } }
En el MIG, crea una solicitud de cambio de tamaño mediante una solicitud
POST
al métodoinstanceGroupManagerResizeRequests.insert
. En el cuerpo de la solicitud, especifica la cantidad de VM de GPU que deseas crear a la vez y la duración por la que deseas ejecutar esas VMs.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/INSTANCE_GROUP_NAME/resizeRequests { "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT }
PROJECT_ID
: El ID del proyecto en el que deseas crear el MIG.INSTANCE_GROUP_NAME
: Es el nombre del MIG.INSTANCE_TEMPLATE_NAME
: Es el nombre de la plantilla de instancias para las VMs con GPU.ZONE
: Una de las zonas disponibles para Compute Engine.RESIZE_REQUEST_NAME
: Es el nombre de la solicitud de cambio de tamaño.COUNT
: la cantidad de VMs que se agregarán a la vez en el grupo.
REST
Para usar las muestras de la API de REST en esta página en un entorno de desarrollo local, debes usar las credenciales que proporcionas a la CLI de gcloud.
After installing the Google Cloud CLI, initialize it by running the following command:
gcloud init
If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
Para obtener más información, consulta Autentica para usar REST en la documentación de autenticación de Google Cloud .
Limitaciones
Revisa las limitaciones para crear una solicitud de cambio de tamaño de MIG.
Crea un MIG y agrega VMs de GPU de una sola vez
Para crear un MIG y agregar todas las VMs de GPU de una sola vez en el grupo, haz lo siguiente:
Crea una plantilla de instancias
Crea una plantilla de instancias como se describe en esta sección y, luego, úsala para crear un MIG.
Console
gcloud
Crea una plantilla de instancias con el comando
beta instance-templates create
:gcloud beta compute instance-templates create INSTANCE_TEMPLATE_NAME \ --image-project=IMAGE_PROJECT \ --image-family=IMAGE_FAMILY \ --instance-termination-action=DELETE \ --instance-template-region=REGION \ --machine-type=MACHINE_TYPE \ --maintenance-policy=TERMINATE \ --max-run-duration=RUN_DURATION \ --provisioning-model=FLEX_START \ --reservation-affinity=none
Reemplaza lo siguiente:
REST
Crea una plantilla de instancias mediante una solicitud
POST
al métodobeta.instanceTemplates.insert
:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/instanceTemplates { "name": "INSTANCE_TEMPLATE_NAME", "properties": { "disks": [ { "boot": true, "initializeParams": { "sourceImage": "projects/IMAGE_PROJECT/global/images/IMAGE } } ], "machineType": "MACHINE_TYPE", "networkInterfaces": [ { "network": "global/networks/default" } ], "reservationAffinity": { "consumeReservationType": "NO_RESERVATION" }, "scheduling": { "instanceTerminationAction": "DELETE", "maxRunDuration": { "seconds": RUN_DURATION }, "onHostMaintenance": "TERMINATE", "provisioningModel": "FLEX_START" } } }
Reemplaza lo siguiente:
Crea un MIG y agrega VMs de GPU de una sola vez
Crea un MIG como se describe en esta sección. Para crear una solicitud de cambio de tamaño en el MIG, no debes configurar el ajuste de escala automático y debes desactivar las reparaciones.
Console
gcloud
Reemplaza lo siguiente:
REST
Reemplaza lo siguiente:
La solicitud de cambio de tamaño que crees permanecerá en el estado
ACCEPTED
hasta que el MIG cree todas las VMs de GPU solicitadas. Después de crear todas las VMs de GPU en el grupo, el estado de la solicitud cambia aSUCCEEDED
.¿Qué sigue?
Obtén información sobre cómo funcionan las solicitudes de cambio de tamaño en un MIG.
Obtén información para crear un MIG regional compatible con las solicitudes de cambio de tamaño (Versión preliminar).
Obtén información para ver, cancelar o borrar solicitudes de cambio de tamaño en un MIG.
Obtén información para ver información sobre los MIG y las VMs administradas.
- Obtén información para ver el uso real y previsto de tus VMs y GPUs.
Salvo que se indique lo contrario, el contenido de esta página está sujeto a la licencia Atribución 4.0 de Creative Commons, y los ejemplos de código están sujetos a la licencia Apache 2.0. Para obtener más información, consulta las políticas del sitio de Google Developers. Java es una marca registrada de Oracle o sus afiliados.
Última actualización: 2025-06-12 (UTC)
-