Etiquetar archivos de Google Drive automáticamente mediante la clasificación de IA

Complementos compatibles con esta función: Gemini Enterprise y AI Security. Comparar complementos

Importante: la versión beta de la clasificación de IA dejó de estar disponible el 9 de abril del 2024. La etiqueta beta tardará entre dos y tres semanas en eliminarse de la consola de administración de Google.

La función de clasificación de IA utiliza la inteligencia artificial (IA) para etiquetar automáticamente el contenido sensible de tu organización. Tras un periodo de entrenamiento inicial, durante el cual el modelo de IA aprende los criterios de tu organización respecto al contenido sensible, la clasificación de IA puede aplicar etiquetas automáticamente a los archivos nuevos y a los que ya tengas en Google Drive.

A continuación, te indicamos cómo empezar a usar la clasificación de IA:

1) Configurar el entrenamiento: para empezar, crea una etiqueta de clasificación, que el modelo de IA aplicará automáticamente a los archivos cuando finalice el entrenamiento. Crearás también la etiqueta de entrenamiento, una etiqueta casi idéntica a la de clasificación.

2) Entrena el modelo: durante el periodo de aprendizaje, normalmente alrededor de una semana, tus etiquetadores designados (usuarios de tu organización que pueden evaluar archivos sensibles) empiezan a clasificar los archivos de Drive con los etiqueta de entrenamiento. A partir de los ejemplos, tu modelo comienza a aprender a clasificar archivos sensibles de forma similar.

3) Activa la clasificación automática: una vez que el modelo se haya entrenado (al cabo de una semana), se te pedirá que actives la clasificación automática. Puedes supervisar de forma continua cuántos archivos se clasifican y con qué precisión.

Para obtener información detallada sobre cada fase, consulta las secciones de los enlaces que aparecen más abajo.

Antes de empezar

  • Si no conoces bien las etiquetas de Drive, consulta el artículo Gestionar etiquetas de Drive para obtener más información sobre cómo funcionan y cómo crearlas.
  • Activa las etiquetas para tu organización:
    1. Inicia sesión en la consola de administración de Google.

      Utiliza tu cuenta de administrador (no termina en @gmail.com).

    2. En la consola de administración, ve a Menú y luego Aplicacionesy luegoGoogle Workspacey luegoDrive y Documentos.
    3. Haz clic en Etiquetas.
    4. Activa las etiquetas.
    5. Haz clic en Guardar.
  • Para obtener los mejores resultados, crea un grupo de configuración para los etiquetadores designados que sea independiente del resto de tu organización. Consulta las instrucciones del artículo Personalizar ajustes de servicios con grupos de configuración.

Configurar entrenamiento

Crea la etiqueta de clasificación

La etiqueta de clasificación es la etiqueta que el modelo de IA aplicará automáticamente a tus archivos sensibles de Drive después de entrenarlo. Te recomendamos que utilices una etiqueta con insignia, que se muestra de forma destacada en los documentos. Para obtener más información sobre las etiquetas con insignia, consulta el artículo Empezar a usar etiquetas de Drive.

Se muestra una etiqueta con insignia junto al título de un archivo

Cuando se utilizan como etiquetas de clasificación, las etiquetas con insignia deben cumplir los siguientes requisitos:

  • Tener solo un campo del tipo Lista de opciones
  • Tener un mínimo de 2 opciones y un máximo de 4
  • Debe estar publicado

Si tienes una etiqueta con insignia que cumpla estos requisitos, puedes usarla como etiqueta de clasificación. Si no, sigue estos pasos y elige la opción de etiqueta con insignia.

Crear la etiqueta de entrenamiento

Te recomendamos que crees la etiqueta de entrenamiento durante la selección de etiquetas (paso siguiente), cuando puedas crearla automáticamente. De esta forma, te aseguras de que la etiqueta de entrenamiento coincida con la etiqueta de clasificación en todas las formas requeridas.

Si decides crear la etiqueta de entrenamiento antes de seleccionarla, haz lo siguiente:

  • Comprueba que la etiqueta cumple los criterios obligatorios de etiquetas.
  • Identifica la etiqueta de entrenamiento con la palabra "entrenamiento" para que tus etiquetadores de confianza puedan reconocerla más fácilmente y aplicarla durante el periodo de entrenamiento.
  • Añade un campo de descripción a la etiqueta de entrenamiento para ayudar a los etiquetadores de confianza a comprender su finalidad.

Seleccionar etiquetas y activar el entrenamiento

  1. Inicia sesión en la consola de administración de Google.

    Utiliza tu cuenta de administrador (no termina en @gmail.com).

  2. En la consola de administración, ve a Menú y luegoSeguridady luegoControl de acceso y de datosy luegoClasificación de datos.
  3. En la clasificación de IA de Google Drive, haz clic en Configurar entrenamiento.
  4. En Seleccionar etiqueta de clasificación, haz clic en Seleccionar etiqueta.
  5. Selecciona la etiqueta con insignia que has creado en la sección Crear la etiqueta de clasificación de este artículo.
  6. En Seleccionar etiqueta de entrenamiento, haz clic en Crear etiqueta de entrenamiento.

    De esta forma, se creará automáticamente una etiqueta de entrenamiento con los mismos atributos que tu etiqueta de clasificación.

  7. Para asegurarte de que la nueva etiqueta esté disponible para los etiquetadores designados, haz clic en Actualizar permisos de etiquetas. La etiqueta se abrirá en el modo de edición del Gestor de etiquetas en otra pestaña.

    Nota: También puedes definir los permisos de etiquetas más adelante. Sin embargo, es importante que solo los etiquetadores tengan acceso a la etiqueta de entrenamiento.

  8. Haz clic en Permisosy luegoEditar y, a continuación, concede el permiso Puede aplicar etiquetas y definir valores al grupo de configuración donde figuran los etiquetadores.
  9. Haz clic en Guardar y cierra la pestaña Gestor de etiquetas.

    Después de seleccionar tanto la etiqueta de clasificación como la etiqueta de entrenamiento, el botón Habilitar entrenamiento se habilita.

  10. Haz clic en Habilitar entrenamiento.

    Importante: Si recibes un mensaje de error al intentar habilitar el entrenamiento, significa que la etiqueta de clasificación y la de entrenamiento no coinciden. Revisa los requisitos de etiquetas que se indican más abajo y asegúrate de que tus etiquetas los cumplen todos. A continuación, habilita el entrenamiento.

Una vez que hayas habilitado el entrenamiento, la página Clasificación de datos mostrará la etiqueta de entrenamiento y la etiqueta de clasificación que hayas seleccionado.

  • La etiqueta de Clasificación muestra el mensaje No está listo. Una vez terminado el entrenamiento, el estado de la etiqueta cambia a Listo.
  • La opción Estado de aplicación automática muestra Desactivado para todos. Una vez que el estado de la etiqueta de clasificación sea Listo, podrás cambiar el estado de aplicación automática a Activado.

A continuación, los etiquetadores designados tendrán que empezar a aplicar la etiqueta Entrenamiento a tus archivos sensibles.

Entrenar el modelo

Para entrenar correctamente el modelo de IA, los etiquetadores designados deben etiquetar al menos 100 archivos por opción. Por ejemplo, si tu etiqueta tiene 3 opciones, se debe aplicar a al menos 300 archivos en total. El modelo de IA comprueba el entrenamiento cada 1 o 2 semanas y muestra el estado Listo cuando tiene 100 ejemplos o más para cada opción de etiqueta. Más información sobre ejemplos de alta calidad

Durante el periodo de entrenamiento, puedes consultar el progreso de cuántos archivos se han etiquetado y de cómo está mejorando la precisión del modelo.

Nota: Los archivos de entrenamiento tienen un límite total de 1 millón.

Para comprobar el progreso durante el periodo de entrenamiento, sigue estos pasos:

  1. En la consola de administración, ve a Seguridady luegoClasificación de datos.
  2. Haz clic en Ver detalles del modelo.
    • En Etiqueta de entrenamiento, Archivos de entrenamiento muestra el número de archivos que se han etiquetado para cada opción.
    • Cada opción de etiqueta tiene una puntuación que muestra el porcentaje de ejemplos de entrenamiento que el modelo ha clasificado correctamente tras probarse.
      • Baja: por debajo del 50 %. El modelo necesita mejores datos de entrenamiento y aún no está listo.
      • Media (50-80 %) El modelo podría estar listo para clasificar archivos de forma limitada.
      • Alta: por encima del 80 %. El modelo está listo para clasificar archivos en tu organización.

Activar la aplicación automática de etiquetas

Una vez que el modelo de IA se haya entrenado para lograr un alto nivel de precisión, podrás elegir las opciones de etiquetas y activar la aplicación automática de etiquetas. Sigue estos pasos:

  1. En la consola de administración, ve a Seguridady luegoClasificación de datos.
  2. En Clasificación de IA, comprueba que en la etiqueta de clasificación se muestre el estado Listo.
  3. Haz clic en Ver detalles del modelo.
  4. En Etiqueta de clasificación, marca las casillas de las opciones de etiqueta que quieras permitir que el modelo de IA aplique automáticamente.
  5. Haz clic en Activar aplicación automática.
  6. Busca y selecciona la unidad organizativa o el grupo a los que quieras asignar etiquetas automáticamente. Por ejemplo, si seleccionas el grupo "Finanzas", luego puedes elegir las etiquetas que quieres configurar para ese grupo.
  7. Haz clic en Activado: la etiqueta se aplica automáticamente.

    Las opciones para aplicar la etiqueta aparecen en la sección Activado.

  8. Haz clic en Guardar.
  9. En la página principal de clasificación de datos, el estado de aplicación automática de la regla cambia a Activado.

¿Cuándo analiza la clasificación de IA los archivos?

La clasificación de IA analiza los archivos en reposo al menos una vez en busca de usuarios y unidades compartidas que tengan habilitada la aplicación automática. Este proceso puede tardar entre una y dos semanas después de habilitar la aplicación automática.

La clasificación de IA también analiza los archivos cuando se suben o se modifican. La etiqueta aplicada puede variar en función de los cambios de contenido que se hagan en el archivo.

Monitorizar eventos de etiquetas de clasificación de IA en el registro de Drive

Puedes obtener información detallada sobre cómo etiqueta los archivos la clasificación de IA consultando los eventos registrados en el registro de Drive.

  1. Ve a Seguridady luegoClasificación de datos.
  2. En la clasificación de IA de Google Drive, haz clic en Ver detalles del modelo.
  3. Haz clic en Ver registros.

    La herramienta de investigación de seguridad se abre en una pestaña nueva y muestra los resultados de búsqueda del registro de Drive de dos eventos relacionados con la clasificación de IA: Etiqueta aplicada y Valor del campo de etiqueta cambiado.

  4. Haz clic en la Descripción del evento para consultar más información, como:
    • Nombre y tipo del documento etiquetado
    • Valor del campo de etiqueta asignado al documento (por ejemplo, Confidencial o Restringido, si estas son tus opciones de etiqueta).

Desactivar la aplicación automática de etiquetas

Puedes desactivar la aplicación automática de todas las etiquetas o desactivar opciones específicas.

  1. Ve a Seguridady luegoClasificación de datos.
  2. En la clasificación de IA de Google Drive, haz clic en Ver detalles del modelo.
    • En Etiqueta de clasificación, desmarca la opción Permitir de la columna Aplicación automática para pausar la aplicación automática de esa opción.
    • Para pausar la aplicación automática por completo, desmarca todas las opciones.
Desactivar la aplicación automática por completo en unidades organizativas o grupos específicos

Utiliza esta opción si quieres desactivar por completo la aplicación automática en el contenido que pertenezca a usuarios de unidades organizativas o grupos concretos.

  1. Ve a Seguridady luegoClasificación de datos.
  2. En la clasificación de IA de Google Drive, haz clic en Ver detalles del modelo.
  3. Haz clic en Gestionar aplicación automática.
  4. Haz clic en una unidad organizativa o un grupo de la izquierda para seleccionarlos.
  5. En Gestionar aplicación automática de IA, haz clic en DESACTIVAR.

Restablecer el modelo

En algún momento, puede que tengas que restablecer el modelo (por ejemplo, para iniciar otra prueba o porque la precisión del modelo no mejora). Si necesitas restablecer el modelo, ten en cuenta lo siguiente:

  • Si restableces el modelo, espera a que se entrene para que la clasificación por IA pueda activar la nueva etiqueta de clasificación y aplicarla a los archivos.
  • Las etiquetas de entrenamiento que hayas aplicado anteriormente permanecerán en los archivos. Después de restablecer el modelo, puedes configurar un modelo nuevo para que use la misma etiqueta de entrenamiento (o una diferente).
  • Las etiquetas aplicadas automáticamente permanecerán en los archivos después de restablecer el modelo.
  • Si eliges la misma etiqueta de clasificación para el modelo nuevo, la función de clasificación de IA ignorará y sobrescribirá las predicciones de modelos anteriores. De esta forma, podrás utilizar el restablecimiento del modelo para "volver a procesar" los archivos de Drive de tu organización. Esto puede ser útil si has hecho mejoras significativas en la calidad de los modelos desde el despliegue inicial.
  1. Ve a Seguridady luegoClasificación de datos.
  2. En la clasificación de IA de Google Drive, haz clic en Ver detalles del modelo.
  3. En la página de detalles del modelo de IA, en Acciones, a la derecha, haz clic en Restablecer modelo.

    En el cuadro de diálogo Restablecer modelo se muestran los efectos de restablecer el modelo.

  4. Para continuar, haz clic en Restablecer modelo.

    La clasificación de IA recupera su estado inicial. Para reiniciar, haz clic en Configurar entrenamiento y elige nuevas etiquetas de clasificación y entrenamiento.

Preguntas frecuentes

Mostrar todo  |  Ocultar todo

¿Cuáles son los requisitos de las etiquetas de entrenamiento y clasificación?

Tanto la etiqueta de clasificación como la de entrenamiento deben cumplir los siguientes criterios:

  • Contener solo un campo, del tipo Lista de opciones o Insignia.
  • Tener un mínimo de 2 opciones y un máximo de 4.
  • Tener las opciones en el mismo orden en cada etiqueta. Por ejemplo, si la etiqueta de clasificación tiene opciones en este orden:
    • 1. Opción 1
    • 2. Opción 2
    • 3. Opción 3

    Las opciones de las etiquetas de entrenamiento no se pueden ordenar de la siguiente manera:

    • 1. Opción 2
    • 2. Opción 1
    • 3. Opción 3
  • Tener etiquetas publicadas.
  • Tener etiquetas con diferentes permisos de acceso. La etiqueta de entrenamiento solo debe estar a disposición de los etiquetadores designados que se consideren de confianza para entrenar el modelo. La etiqueta de clasificación puede tener un acceso más amplio.
¿Puedo usar la etiqueta de clasificación como etiqueta de entrenamiento?
No, la etiqueta de clasificación y la de entrenamiento deben ser diferentes. La etiqueta que elijas como etiqueta de clasificación no se mostrará como opción seleccionable para la etiqueta de entrenamiento.
¿Cuáles son los mejores archivos con los que se debe entrenar el modelo?

Para obtener los mejores resultados al entrenar el modelo, pide a tus etiquetadores de confianza que sigan estas directrices cuando elijas los archivos de entrenamiento:

  • Cada archivo debe tener un mínimo de 500 caracteres de texto como mínimo.
  • Selecciona archivos que representen el contenido real que tus usuarios crean, comparten y usan en tu organización
  • Selecciona aproximadamente la misma cantidad de archivos por opción de etiqueta, con un mínimo de 100 archivos para cada opción. De esta forma, el modelo puede obtener una visión completa de tus datos y mejorar las puntuaciones.
  • Incluye una variedad representativa de archivos para cada tipo de opción. Por ejemplo, no etiquetes 100 currículums como tu conjunto total de archivos de ejemplo de Alto secreto si los contratos también son un tipo de archivo de Alto secreto común en tu organización.
¿La clasificación por IA funciona para etiquetar solo contenido sensible?
El contenido sensible es el elemento principal de la clasificación de IA, pero cualquier etiqueta con hasta 4 opciones se puede entrenar para el etiquetado automático.
¿Puede el modelo entrenarse en varios idiomas?
El modelo admite varios idiomas. sin embargo, en los datos de entrenamiento se debe incluir una variedad representativa de archivos para cada tipo de opción e idioma. Esto aumenta el número de archivos necesarios para entrenar el modelo correctamente. Por ahora, no se admiten sistemas de escritura sin marcadores que limitan las palabras, como el chino y el japonés.
¿Cómo se calculan las puntuaciones?
Durante el entrenamiento, el modelo de IA usa el 75 % de los datos de entrada para entrenarse sobre cómo etiquetar archivos y reserva el 25 % para probar periódicamente su propio rendimiento. Es decir, en el 25 % de los archivos etiquetados, el modelo los analiza como si no supiera qué etiqueta se ha aplicado. A continuación, el modelo de IA elige su propia etiqueta y la compara con la etiqueta real que ha aplicado el etiquetador designado. La puntuación muestra la proporción de los archivos reservados a los que ha asignado correctamente la etiqueta adecuada.
¿Qué ocurre cuando se inhabilita una opción para la aplicación automática?
Durante el análisis, si se prevé que un archivo tenga una opción para la que se ha inhabilitado la aplicación automática, la clasificación de IA no aplica ninguna etiqueta ni valor de campo al archivo.

Los archivos que la clasificación de IA haya etiquetado anteriormente conservan los valores de etiqueta y opción aplicados incluso después de inhabilitar la opción.

¿Cómo y cuándo revisa la clasificación por IA las etiquetas aplicadas automáticamente?

Una vez que se haya creado el modelo y se haya habilitado la aplicación automática, la clasificación de IA analizará y clasificará todos los archivos en reposo de los que se pueda extraer suficiente texto. Estos archivos se analizan al menos una vez.

La clasificación de IA vuelve a procesar los archivos periódicamente a medida que se modifica el contenido. Los cambios de contenido pueden provocar que la predicción de un archivo sea diferente. Cuando la clasificación de IA tenga una opción predicha tanto antigua como nueva para un archivo, preferirá la opción que esté más arriba en la lista de opciones. Por ejemplo, pongamos que un campo tiene tres opciones en el Gestor de etiquetas:

  • Confidencial
  • Interno
  • Público

Supongamos que la clasificación de IA clasifica un archivo como Interno y el contenido cambia de forma que el modelo de clasificación de IA predice Confidencial. En este caso, la clasificación del archivo cambia a Confidencial. Sin embargo, si el modelo de clasificación de IA predice Público, la clasificación del archivo seguirá siendo Interna.

La clasificación de IA no revisa las etiquetas ni los valores de campo aplicados automáticamente que los usuarios hayan revisado o modificado.

En el caso de varios mecanismos de clasificación, como la IA, las reglas de DLP y la clasificación predeterminada, ¿cuál es el que tiene prioridad a la hora de clasificar archivos?
La clasificación de los datos se realiza en el siguiente orden:
  1. Regla de DLP sin sobrescritura del usuario
  2. Clasificación manual
  3. Regla de DLP con sobrescritura de usuario
  4. Clasificación de IA
  5. Clasificación predeterminada
Cuando quitas una etiqueta o un campo, se aplica un mecanismo de clasificación de nivel inferior. Por ejemplo, un archivo con una etiqueta eliminada por un usuario puede tener más adelante la misma etiqueta que la clasificación de IA aplica automáticamente.
¿Hay alguna restricción en cuanto a los tipos de archivos a los que se pueden aplicar etiquetas?
  • Cualquier elemento de Drive puede etiquetarse desde Drive. La aplicación Editor también tiene etiquetado nativo en la experiencia de usuario.
  • La clasificación de IA utiliza el mismo procesamiento de texto indexable que DLP de Drive. Cualquier archivo del que Drive pueda extraer texto indexable se puede evaluar para ver si hay etiquetas aplicadas de clasificación de IA. No es posible extraer texto indexable de todos los archivos, por lo que no se garantiza que la clasificación de IA pueda procesar todos los archivos.
  • La clasificación de IA requiere que un archivo cumpla un umbral de texto mínimo para poder tomar una decisión de clasificación. Por ello, es posible que no se clasifiquen algunos archivos, como los documentos muy cortos o las imágenes con poco texto.
¿Cómo funciona esta función con los usuarios que no disponen de una licencia válida?
Siempre que algunos usuarios del dominio tengan una licencia apta que admita la clasificación con IA, tu administrador podrá entrenar el modelo. Los archivos con la etiqueta de entrenamiento pueden ser propiedad de cualquier usuario que tenga una licencia compatible con etiquetas de Drive. La función de aplicación automática solo aplica etiquetas a los archivos que pertenecen a los usuarios que tienen una licencia compatible con la clasificación de IA; los archivos que sean propiedad de usuarios que no tengan una licencia admitida no los procesa la IA.

Tema relacionado

Empezar a ser Tag Manager de Drive

¿Te ha resultado útil esta información?

¿Cómo podemos mejorar esta página?
Búsqueda
Borrar búsqueda
Cerrar búsqueda
Menú principal
14483138151099351402
true
Buscar en el Centro de ayuda
true
true
true
true
true
73010
false
false