使用 AI 分類功能自動為 Google 雲端硬碟檔案加上標籤

支援這項功能的外掛程式:Gemini Enterprise 和 AI Security。 比較外掛程式

重要事項:AI 分類功能 Beta 版已於 2024 年 4 月 9 日下線。系統需要 2 至 3 週才能在 Google 管理控制台中移除 Beta 版標籤。

AI 分類功能會使用人工智慧 (AI) 技術,自動為貴機構的機密內容加上標籤。在初始訓練期間,AI 模型會學習貴機構對機密內容的定義條件;當訓練期結束後,AI 分類功能便可同時為 Google 雲端硬碟中的新檔案和現有檔案,自動套用標籤。

以下說明如何開始使用 AI 分類功能:

1) 設定訓練:首先,請建立分類標籤供 AI 模型在訓練完成後自動套用至檔案。此外,您還需建立訓練標籤,這種標籤非常類似分類標籤。

2) 訓練模型:在訓練期間 (通常約一週),貴機構指定的標籤人員 (也就是貴機構中負責評估何謂機密檔案的使用者) 就會開始使用訓練標籤,將雲端硬碟檔案分門別類。透過他們提供的樣本,模型會開始學習如何以類似方式分類機密檔案。

3) 啟用自動分類功能:模型訓練完畢後 (約一週後),系統會提示您啟用自動分類功能。您可以持續監控完成分類的檔案數量,以及分類的準確性。

如需各階段的詳細說明,請點選下方各節連結。

事前準備

  • 如果您對雲端硬碟標籤還不熟悉,請參閱「管理雲端硬碟標籤」,進一步瞭解這類標籤的運作方式和建立方法。
  • 為貴機構啟用標籤功能:
    1. 登入 Google 管理控制台

      請使用「管理員帳戶」(結尾「不是」@gmail.com) 登入。

    2. 在管理控制台中,依序點選「選單」圖示  接下來 「應用程式」接下來「Google Workspace」接下來「雲端硬碟與文件」。
    3. 按一下 [標籤]
    4. 啟用標籤。
    5. 按一下「儲存」
  • 為獲得最佳效果,請為指定的標籤人員建立配置群組,將他們與機構中的其他群組分開。如需操作說明,請參閱「使用配置群組自訂服務設定」。

設定訓練

建立分類標籤

分類標籤是 AI 模型完成訓練後,自動為機密雲端硬碟檔案套用的標籤。建議您使用標記標籤來建立分類標籤,這樣在文件中會較為顯眼。如要進一步瞭解標記標籤,請參閱「以雲端硬碟標籤管理員身分開始使用」。

檔案標題旁邊會顯示標記標籤

標記標籤必須符合下列規定,才能做為分類標籤:

  • 只能有一個欄位,且需符合「選項清單」的欄位類型
  • 最少需有 2 個選項,最多 4 個
  • 必須完成發布

如果現有的標記標籤符合上述規定,即可做為分類標籤使用。否則,請按照這些步驟選擇標記標籤選項。

建立訓練標籤

建議您在選取標籤時 (下一個步驟) 建立訓練標籤,因為這樣可以自動建立訓練標籤,確保任何必要屬性都與分類標籤相符。

如果您選擇在選取標籤前建立訓練標籤,請注意以下事項:

  • 確認標籤符合必要的標籤條件
  • 將訓練標籤標上「訓練」字樣,方便您信任的標籤人員在訓練期間辨識並套用標籤。
  • 為訓練標籤新增說明欄位,進一步協助信任的標籤人員瞭解用途。

選取標籤並啟用訓練功能

  1. 登入 Google 管理控制台

    請使用「管理員帳戶」(結尾「不是」@gmail.com) 登入。

  2. 在管理控制台中,依序點選「選單」圖示  接下來 「安全性」接下來「存取權與資料控管」接下來「資料分類」
  3. 在 Google 雲端硬碟的「AI 分類」中,按一下「設定訓練」
  4. 按一下「選取分類標籤」下方的「選取標籤」
  5. 選取您在上方「建立分類標籤」一節建立的標記標籤。
  6. 按一下「選取訓練標籤」下方的「建立訓練標籤」。 

    系統會自動建立與分類標籤屬性相同的訓練標籤。

  7. 按一下「更新標籤權限」,確保指定的標籤人員可以使用新標籤。標籤管理工具隨即會在另一個分頁中,以編輯模式開啟標籤。

    注意:您也可以日後再設定標籤權限。不過,請務必確保只有標籤人員能存取訓練標籤。

  8. 依序按一下「權限」下一步「編輯」,然後為標籤人員所在的配置群組授予「可套用標籤及設定標籤值」權限。
  9. 按一下「儲存」,然後關閉「標籤管理工具」分頁。

    分類標籤和訓練標籤皆選取完畢後,「啟用訓練功能」按鈕就會啟用。

  10. 點選「啟用訓練功能」

    重要事項:如果您在嘗試啟用訓練功能時收到錯誤訊息,代表分類標籤和訓練標籤不相符。請詳閱下方的標籤規定,等確認標籤符合所有規定後,再啟用訓練功能。

啟用訓練功能後,「資料分類」頁面會顯示您選取的訓練標籤和分類標籤。

  • 分類標籤會顯示「尚未就緒」。待訓練完成後,標籤狀態就會變更為「已就緒」
  • 「自動套用狀態」會顯示「為所有人關閉」。當分類標籤的狀態顯示為「已就緒」後,您就可以將「自動套用狀態」變更為「開啟」

接下來,指定的標籤人員就需開始為機密檔案套用訓練標籤了。

訓練模型

為了成功訓練 AI 模型,指定的標籤人員必須針對每個選項,至少為 100 個檔案加上標籤。舉例來說,假設標籤有 3 個選項,則總共至少應有 300 個檔案套用該標籤。AI 模型每 1 至 2 週會檢查一次訓練成果,如果每個標籤選項都有超過 100 個樣本,就會顯示「已就緒」進一步瞭解高品質樣本

在訓練期間,您可以查看已加上標籤的檔案數量,以及模型準確率的改善情形。

注意:訓練檔案的總數上限為 100 萬個。

如要在訓練期間查看進度,請按照下列步驟操作:

  1. 在管理控制台中,依序點選「安全性」下一步「資料分類」
  2. 按一下「查看模型詳細資料」。 
    • 在「訓練用標籤」下方,「訓練用檔案」會顯示每個選項已有多少檔案加上標籤。
    • 每個標籤選項都有一個分數,顯示模型在自行測試後,正確分類的訓練樣本百分比。 
      • 低:低於 50%。表示模型尚未就緒,需要更詳盡的資料。
      • 中:50 到 80%。代表模型可能只在特定情況下準備就緒。
      • 高:超過 80%。表示模型已準備就緒,可為貴機構分類檔案了。

啟用自動套用標籤功能

將 AI 模型訓練到高度準確之後,即可選擇標籤選項並啟用自動套用功能。步驟如下:

  1. 在管理控制台中,依序點選「安全性」下一步「資料分類」
  2. 在「AI 分類」中,確認「分類標籤」的狀態顯示為「已就緒」
  3. 按一下「查看模型詳細資料」
  4. 在「分類標籤」下方,找出要允許 AI 模型自動套用的標籤選項,然後勾選旁邊的方塊。
  5. 按一下「啟用自動套用功能」
  6. 搜尋並選取所需的機構單位或群組,以便納入要自動套用標籤的使用者成員。舉例來說,如果您選取「財務」群組,就可以選取要為「財務」群組設定的標籤。
  7. 按一下「開啟 - 自動套用標籤」

    「開啟」選項下方會列出標籤的套用方式選項。

  8. 按一下「儲存」
  9. 在「資料分類」主頁面上,規則的「自動套用狀態」會變更為「開啟」

監控雲端硬碟記錄中的 AI 分類標籤事件

您可以查看雲端硬碟記錄中的事件,詳細瞭解 AI 分類功能如何為檔案加上標籤。

  1. 依序點選「安全性」下一步「資料分類」
  2. 在 Google 雲端硬碟的「AI 分類」中,按一下「查看模型詳細資料」
  3. 按一下「查看記錄」

    安全調查工具會在新分頁中開啟,顯示下列兩項 AI 分類相關事件的雲端硬碟記錄搜尋結果:「已套用標籤」和「已變更標籤欄位值」

  4. 按一下事件「說明」,查看其他詳細資料,例如:
    • 已加上標籤的文件名稱和類型
    • 指派給文件的標籤欄位值 (例如「機密」或「受限制」,如果這些是您的標籤選項的話)。

停用自動套用標籤功能

您可以停用所有標籤的自動套用功能,也可以只停用特定選項。

  1. 依序點選「安全性」下一步「資料分類」
  2. 在 Google 雲端硬碟的「AI 分類」中,按一下「查看模型詳細資料」
    • 在「分類標籤」部分,取消勾選「自動套用」欄中的「允許」,即可暫停自動套用該選項。
    • 如要完全暫停自動套用,請取消勾選所有選項。
為特定機構單位或群組全面停用自動套用功能

如果您要對特定機構單位/群組內使用者擁有的內容,全面停用自動套用功能,請使用這個選項。

  1. 依序點選「安全性」下一步「資料分類」
  2. 在 Google 雲端硬碟的「AI 分類」中,按一下「查看模型詳細資料」
  3. 按一下「管理自動套用功能」
  4. 按一下左側的機構單位或群組即可選取。
  5. 在「管理 AI 自動套用功能」中,按一下「關閉」

重設模型

在某些情況下,您可能需要重設模型,比方說是為了啟動另一項測試,或是因為模型準確度並未提升。如需重設模型,請注意下列事項:

  • 如果您重設模型,請等到模型訓練完成,AI 分類功能才能啟用新的分類標籤並套用至檔案上。
  • 先前套用的訓練標籤仍會保留在檔案中。您可以在重設模型後,選擇設定新模型,使用相同 (或不同) 的訓練標籤。
  • 重設模型後,先前套用的標籤仍會保留在檔案中。
  • 如果您為新模型選擇相同的分類標籤,AI 分類功能會忽略並覆寫先前模型的預測結果。這樣一來,您就可以使用模型,將貴機構的雲端硬碟檔案設為「重新處理」。如果您在初次部署後曾大幅提升模型品質,這個方法就很有用。
  1. 依序點選「安全性」下一步「資料分類」
  2. 在 Google 雲端硬碟的「AI 分類」中,按一下「查看模型詳細資料」
  3. 在 AI 模型詳細資料頁面的「動作」下方,按一下右側的「重設模型」

    「重設模型」對話方塊會列出重設模型帶來的影響。

  4. 如要繼續,請按一下「重設模型」

    AI 分類功能會重設為初始狀態。請按一下「設定訓練」,然後選擇新的分類和訓練標籤,從頭開始操作。

常見問題

訓練標籤和分類標籤有什麼規定嗎?

分類標籤和訓練標籤必須同時符合以下條件:

  • 只能有一個欄位,且需符合「選項清單」的欄位類型。
  • 最少需有 2 個選項,最多 4 個。
  • 各標籤中第 2 到第 4 個選項的順序必須相同。舉例來說,如果分類標籤的選項順序如下:
    • 1. 選項 1
    • 2. 選項 2
    • 3. 選項 3

    訓練標籤選項的順序就不能像下面這樣:

    • 1. 選項 2
    • 2. 選項 1
    • 3. 選項 3
  • 這兩個標籤都必須完成發布。
  • 標籤應有不同的存取權限。訓練標籤應僅供可信任的指定標籤人員用於訓練模型。分類標籤的存取權設定則可較廣。
我可以使用分類標籤做為訓練標籤嗎?
不行。分類標籤和訓練標籤必須為兩個不同的標籤。標籤一經選做分類標籤,就不會顯示為訓練標籤選項。
哪些檔案適合用來訓練模型?

為確保訓練模型時能獲得最佳結果,請指示信任的標籤人員遵守下列規範來選擇訓練檔案:

  • 每個檔案必須包含至少約 500 個半形文字字元。
  • 所選檔案需盡可能忠實反映使用者在貴機構中建立、共用和使用的內容
  • 每個標籤選項所選的檔案數量需大致相同,且各選項至少要有 100 個檔案。這有利於模型全面解讀資料,進而提高分數。
  • 每種選項類型都要納入具代表性的檔案。舉例來說,如果合約在貴機構也是常見的「最高機密」檔案類型,「最高機密」標籤的 100 份檔案樣本就不能全是履歷檔案。
AI 分類功能是否只能用於為機密內容加上標籤?
雖然 AI 分類功能的主要重心是在機密內容,但只要標籤的選項不超過 4 個,在訓練後也能自動加上標籤。
分數的計算方式為何?
在訓練期間,AI 模型會使用 75% 的輸入資料自我訓練,學習如何為檔案加上標籤,並保留 25% 的資料用於定期測試成效。也就是說,模型在分析這 25% 的檔案時,會將其視為不清楚套用何種標籤,但其實這些檔案皆已加上標籤。接著,模型會自行選擇標籤,並將這個標籤與指定標籤人員套用的實際標籤比較。最後,在保留的檔案中,有多少比例的檔案已分配到正確的標籤,就是分數的計算依據。
AI 加上標籤的檔案總數如何計算?
檔案必須由 AI 分類功能自動加上標籤,且標籤後續未經使用者編輯或接受,才會計入「由 AI 加上標籤的檔案」下的總數。舉例來說,如果您的模型自動為某檔案加上「機密」標籤,且使用者後續未對該標籤採取任何行動 (例如接受、變更或移除標籤),這個檔案就會計入由 AI 加上標籤的檔案總數。如果使用者接受標籤,或是在 AI 初步分類之後便將「機密」標籤改為「內部」,該檔案就不會再計入「由 AI 加上標籤的檔案」總數中。
我可以在哪裡進一步瞭解 AI 分類功能的運作方式?
如要進一步瞭解 Google 的資料分類做法,以及雲端硬碟的 AI 分類功能如何運作,請參閱《Google Workspace AI 分類白皮書》。

相關主題

以雲端硬碟標籤管理員身分開始使用

這對您有幫助嗎?

我們應如何改進呢?
搜尋
清除搜尋內容
關閉搜尋
主選單
15331260199720123201
true
搜尋說明中心
true
true
true
true
true
73010
false
false