使用 AI 分類功能自動為 Google 雲端硬碟檔案加上標籤

支援這項功能的外掛程式:Gemini Enterprise 和 AI Security。 比較外掛程式

重要事項:AI 分類功能 Beta 版已於 2024 年 4 月 9 日下線。系統需要 2 至 3 週才能在 Google 管理控制台中移除 Beta 版標籤。

AI 分類功能會使用人工智慧 (AI) 技術,自動為貴機構的機密內容加上標籤。在初始訓練期間,AI 模型會學習貴機構對機密內容的定義條件;當訓練期結束後,AI 分類功能便可同時為 Google 雲端硬碟中的新檔案和現有檔案,自動套用標籤。

以下說明如何開始使用 AI 分類功能:

1) 設定訓練:首先,請建立分類標籤供 AI 模型在訓練完成後自動套用至檔案。此外,您還需建立訓練標籤,這種標籤非常類似分類標籤。

2) 訓練模型:在訓練期間 (通常約一週),貴機構指定的標籤人員 (也就是貴機構中負責評估何謂機密檔案的使用者) 就會開始使用訓練標籤,將雲端硬碟檔案分門別類。透過他們提供的樣本,模型會開始學習如何以類似方式分類機密檔案。

3) 啟用自動分類功能:模型訓練完畢後 (約一週後),系統會提示您啟用自動分類功能。您可以持續監控完成分類的檔案數量,以及分類的準確性。

如需各階段的詳細說明,請點選下方各節連結。

事前準備

  • 如果您對雲端硬碟標籤還不熟悉,請參閱「管理雲端硬碟標籤」,進一步瞭解這類標籤的運作方式和建立方法。
  • 為貴機構啟用標籤功能:
    1. 登入 Google 管理控制台

      請使用「管理員帳戶」(結尾「不是」@gmail.com) 登入。

    2. 在管理控制台中,依序點選「選單」圖示  接下來 「應用程式」接下來「Google Workspace」接下來「雲端硬碟與文件」。
    3. 按一下 [標籤]
    4. 啟用標籤。
    5. 按一下「儲存」
  • 為獲得最佳效果,請為指定的標籤人員建立配置群組,將他們與機構中的其他群組分開。如需操作說明,請參閱「使用配置群組自訂服務設定」。

設定訓練

建立分類標籤

分類標籤是 AI 模型完成訓練後,自動為機密雲端硬碟檔案套用的標籤。建議您使用標記標籤來建立分類標籤,這樣在文件中會較為顯眼。如要進一步瞭解標記標籤,請參閱「以雲端硬碟標籤管理員身分開始使用」。

檔案標題旁邊會顯示標記標籤

標記標籤必須符合下列規定,才能做為分類標籤:

  • 只能有一個欄位,且需符合「選項清單」的欄位類型
  • 最少需有 2 個選項,最多 4 個
  • 必須完成發布

如果現有的標記標籤符合上述規定,即可做為分類標籤使用。否則,請按照這些步驟選擇標記標籤選項。

建立訓練標籤

建議您在選取標籤時 (下一個步驟) 建立訓練標籤,因為這樣可以自動建立訓練標籤,確保任何必要屬性都與分類標籤相符。

如果您選擇在選取標籤前建立訓練標籤,請注意以下事項:

  • 確認標籤符合必要的標籤條件
  • 將訓練標籤標上「訓練」字樣,方便您信任的標籤人員在訓練期間辨識並套用標籤。
  • 為訓練標籤新增說明欄位,進一步協助信任的標籤人員瞭解用途。

選取標籤並啟用訓練功能

  1. 登入 Google 管理控制台

    請使用「管理員帳戶」(結尾「不是」@gmail.com) 登入。

  2. 在管理控制台中,依序點選「選單」圖示  接下來 「安全性」接下來「存取權與資料控管」接下來「資料分類」
  3. 在 Google 雲端硬碟的「AI 分類」中,按一下「設定訓練」
  4. 按一下「選取分類標籤」下方的「選取標籤」
  5. 選取您在上方「建立分類標籤」一節建立的標記標籤。
  6. 按一下「選取訓練標籤」下方的「建立訓練標籤」。 

    系統會自動建立與分類標籤屬性相同的訓練標籤。

  7. 按一下「更新標籤權限」,確保指定的標籤人員可以使用新標籤。標籤管理工具隨即會在另一個分頁中,以編輯模式開啟標籤。

    注意:您也可以日後再設定標籤權限。不過,請務必確保只有標籤人員能存取訓練標籤。

  8. 依序按一下「權限」下一步「編輯」,然後為標籤人員所在的配置群組授予「可套用標籤及設定標籤值」權限。
  9. 按一下「儲存」,然後關閉「標籤管理工具」分頁。

    分類標籤和訓練標籤皆選取完畢後,「啟用訓練功能」按鈕就會啟用。

  10. 點選「啟用訓練功能」

    重要事項:如果您在嘗試啟用訓練功能時收到錯誤訊息,代表分類標籤和訓練標籤不相符。請詳閱下方的標籤規定,等確認標籤符合所有規定後,再啟用訓練功能。

啟用訓練功能後,「資料分類」頁面會顯示您選取的訓練標籤和分類標籤。

  • 分類標籤會顯示「尚未就緒」。待訓練完成後,標籤狀態就會變更為「已就緒」
  • 「自動套用狀態」會顯示「為所有人關閉」。當分類標籤的狀態顯示為「已就緒」後,您就可以將「自動套用狀態」變更為「開啟」

接下來,指定的標籤人員就需開始為機密檔案套用訓練標籤了。

訓練模型

為了成功訓練 AI 模型,指定的標籤人員必須針對每個選項,至少為 100 個檔案加上標籤。舉例來說,假設標籤有 3 個選項,則總共至少應有 300 個檔案套用該標籤。AI 模型每 1 至 2 週會檢查一次訓練成果,如果每個標籤選項都有超過 100 個樣本,就會顯示「已就緒」進一步瞭解高品質樣本

在訓練期間,您可以查看已加上標籤的檔案數量,以及模型準確率的改善情形。

注意:訓練檔案的總數上限為 100 萬個。

如要在訓練期間查看進度,請按照下列步驟操作:

  1. 在管理控制台中,依序點選「安全性」下一步「資料分類」
  2. 按一下「查看模型詳細資料」。 
    • 在「訓練用標籤」下方,「訓練用檔案」會顯示每個選項已有多少檔案加上標籤。
    • 每個標籤選項都有一個分數,顯示模型在自行測試後,正確分類的訓練樣本百分比。 
      • 低:低於 50%。表示模型尚未就緒,需要更詳盡的資料。
      • 中:50 到 80%。代表模型可能只在特定情況下準備就緒。
      • 高:超過 80%。表示模型已準備就緒,可為貴機構分類檔案了。

啟用自動套用標籤功能

將 AI 模型訓練到高度準確之後,即可選擇標籤選項並啟用自動套用功能。步驟如下:

  1. 在管理控制台中,依序點選「安全性」下一步「資料分類」
  2. 在「AI 分類」中,確認「分類標籤」的狀態顯示為「已就緒」
  3. 按一下「查看模型詳細資料」
  4. 在「分類標籤」下方,找出要允許 AI 模型自動套用的標籤選項,然後勾選旁邊的方塊。
  5. 按一下「啟用自動套用功能」
  6. 搜尋並選取所需的機構單位或群組,以便納入要自動套用標籤的使用者成員。舉例來說,如果您選取「財務」群組,就可以選取要為「財務」群組設定的標籤。
  7. 按一下「開啟 - 自動套用標籤」

    「開啟」選項下方會列出標籤的套用方式選項。

  8. 按一下「儲存」
  9. 在「資料分類」主頁面上,規則的「自動套用狀態」會變更為「開啟」

監控雲端硬碟記錄中的 AI 分類標籤事件

您可以查看雲端硬碟記錄中的事件,詳細瞭解 AI 分類功能如何為檔案加上標籤。

  1. 依序點選「安全性」下一步「資料分類」
  2. 在 Google 雲端硬碟的「AI 分類」中,按一下「查看模型詳細資料」
  3. 按一下「查看記錄」

    安全調查工具會在新分頁中開啟,顯示下列兩項 AI 分類相關事件的雲端硬碟記錄搜尋結果:「已套用標籤」和「已變更標籤欄位值」

  4. 按一下事件「說明」,查看其他詳細資料,例如:
    • 已加上標籤的文件名稱和類型
    • 指派給文件的標籤欄位值 (例如「機密」或「受限制」,如果這些是您的標籤選項的話)。

停用自動套用標籤功能

您可以停用所有標籤的自動套用功能,也可以只停用特定選項。

  1. 依序點選「安全性」下一步「資料分類」
  2. 在 Google 雲端硬碟的「AI 分類」中,按一下「查看模型詳細資料」
    • 在「分類標籤」部分,取消勾選「自動套用」欄中的「允許」,即可暫停自動套用該選項。
    • 如要完全暫停自動套用,請取消勾選所有選項。
為特定機構單位或群組全面停用自動套用功能

如果您要對特定機構單位/群組內使用者擁有的內容,全面停用自動套用功能,請使用這個選項。

  1. 依序點選「安全性」下一步「資料分類」
  2. 在 Google 雲端硬碟的「AI 分類」中,按一下「查看模型詳細資料」
  3. 按一下「管理自動套用功能」
  4. 按一下左側的機構單位或群組即可選取。
  5. 在「管理 AI 自動套用功能」中,按一下「關閉」

重設模型

在某些情況下,您可能需要重設模型,比方說是為了啟動另一項測試,或是因為模型準確度並未提升。如需重設模型,請注意下列事項:

  • 如果您重設模型,請等到模型訓練完成,AI 分類功能才能啟用新的分類標籤並套用至檔案上。
  • 先前套用的訓練標籤仍會保留在檔案中。您可以在重設模型後,選擇設定新模型,使用相同 (或不同) 的訓練標籤。
  • 重設模型後,先前套用的標籤仍會保留在檔案中。
  • 如果您為新模型選擇相同的分類標籤,AI 分類功能會忽略並覆寫先前模型的預測結果。這樣一來,您就可以使用模型,將貴機構的雲端硬碟檔案設為「重新處理」。如果您在初次部署後曾大幅提升模型品質,這個方法就很有用。
  1. 依序點選「安全性」下一步「資料分類」
  2. 在 Google 雲端硬碟的「AI 分類」中,按一下「查看模型詳細資料」
  3. 在 AI 模型詳細資料頁面的「動作」下方,按一下右側的「重設模型」

    「重設模型」對話方塊會列出重設模型帶來的影響。

  4. 如要繼續,請按一下「重設模型」

    AI 分類功能會重設為初始狀態。請按一下「設定訓練」,然後選擇新的分類和訓練標籤,從頭開始操作。

常見問題

訓練標籤和分類標籤有什麼規定嗎?

分類標籤和訓練標籤必須同時符合以下條件:

  • 只能有一個欄位,且需符合「選項清單」的欄位類型。
  • 最少需有 2 個選項,最多 4 個。
  • 各標籤中第 2 到第 4 個選項的順序必須相同。舉例來說,如果分類標籤的選項順序如下:
    • 1. 選項 1
    • 2. 選項 2
    • 3. 選項 3

    訓練標籤選項的順序就不能像下面這樣:

    • 1. 選項 2
    • 2. 選項 1
    • 3. 選項 3
  • 這兩個標籤都必須完成發布。
  • 標籤應有不同的存取權限。訓練標籤應僅供可信任的指定標籤人員用於訓練模型。分類標籤的存取權設定則可較廣。
我可以使用分類標籤做為訓練標籤嗎?
不行。分類標籤和訓練標籤必須為兩個不同的標籤。標籤一經選做分類標籤,就不會顯示為訓練標籤選項。
哪些檔案適合用來訓練模型?

為確保訓練模型時能獲得最佳結果,請指示信任的標籤人員遵守下列規範來選擇訓練檔案:

  • 每個檔案必須包含至少約 500 個半形文字字元。
  • 所選檔案需盡可能忠實反映使用者在貴機構中建立、共用和使用的內容
  • 每個標籤選項所選的檔案數量需大致相同,且各選項至少要有 100 個檔案。這有利於模型全面解讀資料,進而提高分數。
  • 每種選項類型都要納入具代表性的檔案。舉例來說,如果合約在貴機構也是常見的「最高機密」檔案類型,「最高機密」標籤的 100 份檔案樣本就不能全是履歷檔案。
AI 分類功能是否只能用於為機密內容加上標籤?
雖然 AI 分類功能的主要重心是在機密內容,但只要標籤的選項不超過 4 個,在訓練後也能自動加上標籤。
分數的計算方式為何?
在訓練期間,AI 模型會使用 75% 的輸入資料自我訓練,學習如何為檔案加上標籤,並保留 25% 的資料用於定期測試成效。也就是說,模型在分析這 25% 的檔案時,會將其視為不清楚套用何種標籤,但其實這些檔案皆已加上標籤。接著,模型會自行選擇標籤,並將這個標籤與指定標籤人員套用的實際標籤比較。最後,在保留的檔案中,有多少比例的檔案已分配到正確的標籤,就是分數的計算依據。
AI 加上標籤的檔案總數如何計算?
檔案必須由 AI 分類功能自動加上標籤,且標籤後續未經使用者編輯或接受,才會計入「由 AI 加上標籤的檔案」下的總數。舉例來說,如果您的模型自動為某檔案加上「機密」標籤,且使用者後續未對該標籤採取任何行動 (例如接受、變更或移除標籤),這個檔案就會計入由 AI 加上標籤的檔案總數。如果使用者接受標籤,或是在 AI 初步分類之後便將「機密」標籤改為「內部」,該檔案就不會再計入「由 AI 加上標籤的檔案」總數中。
我可以在哪裡進一步瞭解 AI 分類功能的運作方式?
如要進一步瞭解 Google 的資料分類做法,以及雲端硬碟的 AI 分類功能如何運作,請參閱《Google Workspace AI 分類白皮書》。

相關主題

以雲端硬碟標籤管理員身分開始使用

這對您有幫助嗎?

我們應如何改進呢?
搜尋
清除搜尋內容
關閉搜尋
Google 應用程式
主選單