使用 AI 分類功能自動為 Google 雲端硬碟檔案加上標籤

支援這項功能的外掛程式：Gemini Enterprise 和 AI Security。 比較外掛程式

重要事項：AI 分類功能 Beta 版已於 2024 年 4 月 9 日下線。系統需要 2 至 3 週才能在 Google 管理控制台中移除 Beta 版標籤。

AI 分類功能會使用人工智慧 (AI) 技術，自動為貴機構的機密內容加上標籤。在初始訓練期間，AI 模型會學習貴機構對機密內容的定義條件；當訓練期結束後，AI 分類功能便可同時為 Google 雲端硬碟中的新檔案和現有檔案，自動套用標籤。

以下說明如何開始使用 AI 分類功能：

1) 設定訓練：首先，請建立分類標籤供 AI 模型在訓練完成後自動套用至檔案。此外，您還需建立訓練標籤，這種標籤非常類似分類標籤。

2) 訓練模型：在訓練期間 (通常約一週)，貴機構指定的標籤人員 (也就是貴機構中負責評估何謂機密檔案的使用者) 就會開始使用訓練標籤，將雲端硬碟檔案分門別類。透過他們提供的樣本，模型會開始學習如何以類似方式分類機密檔案。

3) 啟用自動分類功能：模型訓練完畢後 (約一週後)，系統會提示您啟用自動分類功能。您可以持續監控完成分類的檔案數量，以及分類的準確性。

如需各階段的詳細說明，請點選下方各節連結。

事前準備

如果您對雲端硬碟標籤還不熟悉，請參閱「管理雲端硬碟標籤」，進一步瞭解這類標籤的運作方式和建立方法。
為貴機構啟用標籤功能：
1. 登入 Google 管理控制台。
  請使用「管理員帳戶」(結尾「不是」@gmail.com) 登入。
2. 在管理控制台中，依序點選「選單」圖示「應用程式」「Google Workspace」「雲端硬碟與文件」。
3. 按一下 [標籤]。
4. 啟用標籤。
5. 按一下「儲存」。
為獲得最佳效果，請為指定的標籤人員建立配置群組，將他們與機構中的其他群組分開。如需操作說明，請參閱「使用配置群組自訂服務設定」。

設定訓練

建立分類標籤

分類標籤是 AI 模型完成訓練後，自動為機密雲端硬碟檔案套用的標籤。建議您使用標記標籤來建立分類標籤，這樣在文件中會較為顯眼。如要進一步瞭解標記標籤，請參閱「以雲端硬碟標籤管理員身分開始使用」。

檔案標題旁邊會顯示標記標籤

標記標籤必須符合下列規定，才能做為分類標籤：

只能有一個欄位，且需符合「選項清單」的欄位類型
最少需有 2 個選項，最多 4 個
必須完成發布

如果現有的標記標籤符合上述規定，即可做為分類標籤使用。否則，請按照這些步驟選擇標記標籤選項。

建立訓練標籤

建議您在選取標籤時 (下一個步驟) 建立訓練標籤，因為這樣可以自動建立訓練標籤，確保任何必要屬性都與分類標籤相符。

如果您選擇在選取標籤前建立訓練標籤，請注意以下事項：

確認標籤符合必要的標籤條件。
將訓練標籤標上「訓練」字樣，方便您信任的標籤人員在訓練期間辨識並套用標籤。
為訓練標籤新增說明欄位，進一步協助信任的標籤人員瞭解用途。

選取標籤並啟用訓練功能

登入 Google 管理控制台。
請使用「管理員帳戶」(結尾「不是」@gmail.com) 登入。
在管理控制台中，依序點選「選單」圖示「安全性」「存取權與資料控管」「資料分類」。
在 Google 雲端硬碟的「AI 分類」中，按一下「設定訓練」。
按一下「選取分類標籤」下方的「選取標籤」。
選取您在上方「建立分類標籤」一節建立的標記標籤。
按一下「選取訓練標籤」下方的「建立訓練標籤」。
系統會自動建立與分類標籤屬性相同的訓練標籤。
按一下「更新標籤權限」，確保指定的標籤人員可以使用新標籤。標籤管理工具隨即會在另一個分頁中，以編輯模式開啟標籤。
注意：您也可以日後再設定標籤權限。不過，請務必確保只有標籤人員能存取訓練標籤。
依序按一下「權限」「編輯」，然後為標籤人員所在的配置群組授予「可套用標籤及設定標籤值」權限。
按一下「儲存」，然後關閉「標籤管理工具」分頁。
分類標籤和訓練標籤皆選取完畢後，「啟用訓練功能」按鈕就會啟用。
點選「啟用訓練功能」。
重要事項：如果您在嘗試啟用訓練功能時收到錯誤訊息，代表分類標籤和訓練標籤不相符。請詳閱下方的標籤規定，等確認標籤符合所有規定後，再啟用訓練功能。

啟用訓練功能後，「資料分類」頁面會顯示您選取的訓練標籤和分類標籤。

分類標籤會顯示「尚未就緒」。待訓練完成後，標籤狀態就會變更為「已就緒」。
「自動套用狀態」會顯示「為所有人關閉」。當分類標籤的狀態顯示為「已就緒」後，您就可以將「自動套用狀態」變更為「開啟」。

接下來，指定的標籤人員就需開始為機密檔案套用訓練標籤了。

訓練模型

為了成功訓練 AI 模型，指定的標籤人員必須針對每個選項，至少為 100 個檔案加上標籤。舉例來說，假設標籤有 3 個選項，則總共至少應有 300 個檔案套用該標籤。AI 模型每 1 至 2 週會檢查一次訓練成果，如果每個標籤選項都有超過 100 個樣本，就會顯示「已就緒」。進一步瞭解高品質樣本。

在訓練期間，您可以查看已加上標籤的檔案數量，以及模型準確率的改善情形。

注意：訓練檔案的總數上限為 100 萬個。

如要在訓練期間查看進度，請按照下列步驟操作：

在管理控制台中，依序點選「安全性」「資料分類」。
按一下「查看模型詳細資料」。
- 在「訓練用標籤」下方，「訓練用檔案」會顯示每個選項已有多少檔案加上標籤。
- 每個標籤選項都有一個分數，顯示模型在自行測試後，正確分類的訓練樣本百分比。
  - 低：低於 50%。表示模型尚未就緒，需要更詳盡的資料。
  - 中：50 到 80%。代表模型可能只在特定情況下準備就緒。
  - 高：超過 80%。表示模型已準備就緒，可為貴機構分類檔案了。

啟用自動套用標籤功能

將 AI 模型訓練到高度準確之後，即可選擇標籤選項並啟用自動套用功能。步驟如下：

在管理控制台中，依序點選「安全性」「資料分類」。
在「AI 分類」中，確認「分類標籤」的狀態顯示為「已就緒」。
按一下「查看模型詳細資料」。
在「分類標籤」下方，找出要允許 AI 模型自動套用的標籤選項，然後勾選旁邊的方塊。
按一下「啟用自動套用功能」。
搜尋並選取所需的機構單位或群組，以便納入要自動套用標籤的使用者成員。舉例來說，如果您選取「財務」群組，就可以選取要為「財務」群組設定的標籤。
按一下「開啟 - 自動套用標籤」。
「開啟」選項下方會列出標籤的套用方式選項。
按一下「儲存」。
在「資料分類」主頁面上，規則的「自動套用狀態」會變更為「開啟」。

監控雲端硬碟記錄中的 AI 分類標籤事件

您可以查看雲端硬碟記錄中的事件，詳細瞭解 AI 分類功能如何為檔案加上標籤。

依序點選「安全性」「資料分類」。
在 Google 雲端硬碟的「AI 分類」中，按一下「查看模型詳細資料」。
按一下「查看記錄」。
安全調查工具會在新分頁中開啟，顯示下列兩項 AI 分類相關事件的雲端硬碟記錄搜尋結果：「已套用標籤」和「已變更標籤欄位值」。
按一下事件「說明」，查看其他詳細資料，例如：
- 已加上標籤的文件名稱和類型
- 指派給文件的標籤欄位值 (例如「機密」或「受限制」，如果這些是您的標籤選項的話)。

停用自動套用標籤功能

您可以停用所有標籤的自動套用功能，也可以只停用特定選項。

依序點選「安全性」「資料分類」。
在 Google 雲端硬碟的「AI 分類」中，按一下「查看模型詳細資料」。
- 在「分類標籤」部分，取消勾選「自動套用」欄中的「允許」，即可暫停自動套用該選項。
- 如要完全暫停自動套用，請取消勾選所有選項。

為特定機構單位或群組全面停用自動套用功能

如果您要對特定機構單位/群組內使用者擁有的內容，全面停用自動套用功能，請使用這個選項。

依序點選「安全性」「資料分類」。
在 Google 雲端硬碟的「AI 分類」中，按一下「查看模型詳細資料」。
按一下「管理自動套用功能」。
按一下左側的機構單位或群組即可選取。
在「管理 AI 自動套用功能」中，按一下「關閉」。

重設模型

在某些情況下，您可能需要重設模型，比方說是為了啟動另一項測試，或是因為模型準確度並未提升。如需重設模型，請注意下列事項：

如果您重設模型，請等到模型訓練完成，AI 分類功能才能啟用新的分類標籤並套用至檔案上。
先前套用的訓練標籤仍會保留在檔案中。您可以在重設模型後，選擇設定新模型，使用相同 (或不同) 的訓練標籤。
重設模型後，先前套用的標籤仍會保留在檔案中。
如果您為新模型選擇相同的分類標籤，AI 分類功能會忽略並覆寫先前模型的預測結果。這樣一來，您就可以使用模型，將貴機構的雲端硬碟檔案設為「重新處理」。如果您在初次部署後曾大幅提升模型品質，這個方法就很有用。

依序點選「安全性」「資料分類」。
在 Google 雲端硬碟的「AI 分類」中，按一下「查看模型詳細資料」。
在 AI 模型詳細資料頁面的「動作」下方，按一下右側的「重設模型」。
「重設模型」對話方塊會列出重設模型帶來的影響。
如要繼續，請按一下「重設模型」。
AI 分類功能會重設為初始狀態。請按一下「設定訓練」，然後選擇新的分類和訓練標籤，從頭開始操作。

常見問題

訓練標籤和分類標籤有什麼規定嗎？

分類標籤和訓練標籤必須同時符合以下條件：

只能有一個欄位，且需符合「選項清單」的欄位類型。
最少需有 2 個選項，最多 4 個。
各標籤中第 2 到第 4 個選項的順序必須相同。舉例來說，如果分類標籤的選項順序如下：
- 1. 選項 1
- 2. 選項 2
- 3. 選項 3
訓練標籤選項的順序就不能像下面這樣：
- 1. 選項 2
- 2. 選項 1
- 3. 選項 3
這兩個標籤都必須完成發布。
標籤應有不同的存取權限。訓練標籤應僅供可信任的指定標籤人員用於訓練模型。分類標籤的存取權設定則可較廣。

我可以使用分類標籤做為訓練標籤嗎？

不行。分類標籤和訓練標籤必須為兩個不同的標籤。標籤一經選做分類標籤，就不會顯示為訓練標籤選項。

哪些檔案適合用來訓練模型？

為確保訓練模型時能獲得最佳結果，請指示信任的標籤人員遵守下列規範來選擇訓練檔案：

每個檔案必須包含至少約 500 個半形文字字元。
所選檔案需盡可能忠實反映使用者在貴機構中建立、共用和使用的內容
每個標籤選項所選的檔案數量需大致相同，且各選項至少要有 100 個檔案。這有利於模型全面解讀資料，進而提高分數。
每種選項類型都要納入具代表性的檔案。舉例來說，如果合約在貴機構也是常見的「最高機密」檔案類型，「最高機密」標籤的 100 份檔案樣本就不能全是履歷檔案。

AI 分類功能是否只能用於為機密內容加上標籤？

雖然 AI 分類功能的主要重心是在機密內容，但只要標籤的選項不超過 4 個，在訓練後也能自動加上標籤。

分數的計算方式為何？

在訓練期間，AI 模型會使用 75% 的輸入資料自我訓練，學習如何為檔案加上標籤，並保留 25% 的資料用於定期測試成效。也就是說，模型在分析這 25% 的檔案時，會將其視為不清楚套用何種標籤，但其實這些檔案皆已加上標籤。接著，模型會自行選擇標籤，並將這個標籤與指定標籤人員套用的實際標籤比較。最後，在保留的檔案中，有多少比例的檔案已分配到正確的標籤，就是分數的計算依據。

AI 加上標籤的檔案總數如何計算？

檔案必須由 AI 分類功能自動加上標籤，且標籤後續未經使用者編輯或接受，才會計入「由 AI 加上標籤的檔案」下的總數。舉例來說，如果您的模型自動為某檔案加上「機密」標籤，且使用者後續未對該標籤採取任何行動 (例如接受、變更或移除標籤)，這個檔案就會計入由 AI 加上標籤的檔案總數。如果使用者接受標籤，或是在 AI 初步分類之後便將「機密」標籤改為「內部」，該檔案就不會再計入「由 AI 加上標籤的檔案」總數中。

我可以在哪裡進一步瞭解 AI 分類功能的運作方式？

如要進一步瞭解 Google 的資料分類做法，以及雲端硬碟的 AI 分類功能如何運作，請參閱《Google Workspace AI 分類白皮書》。

這對您有幫助嗎？

我們應如何改進呢？