使用 AI 分類功能自動為 Google 雲端硬碟檔案加上標籤

支援這項功能的外掛程式:Gemini Enterprise 和 AI Security。 比較外掛程式

重要事項:AI 分類功能 Beta 版已於 2024 年 4 月 9 日下線。系統需要 2 至 3 週才能在 Google 管理控制台中移除 Beta 版標籤。

AI 分類功能會使用人工智慧 (AI) 技術,自動為貴機構的機密內容加上標籤。在初始訓練期間,AI 模型會學習貴機構對機密內容的定義條件;當訓練期結束後,AI 分類功能便可同時為 Google 雲端硬碟中的新檔案和現有檔案,自動套用標籤。

以下說明如何開始使用 AI 分類功能:

1) 設定訓練:首先,請建立分類標籤供 AI 模型在訓練完成後自動套用至檔案。此外,您還需建立訓練標籤,這種標籤非常類似分類標籤。

2) 訓練模型:在訓練期間 (通常約一週),貴機構指定的標籤人員 (也就是貴機構中負責評估何謂機密檔案的使用者) 就會開始使用訓練標籤,將雲端硬碟檔案分門別類。透過他們提供的樣本,模型會開始學習如何以類似方式分類機密檔案。

3) 啟用自動分類功能:模型訓練完畢後 (約一週後),系統會提示您啟用自動分類功能。您可以持續監控完成分類的檔案數量,以及分類的準確性。

如需各階段的詳細說明,請點選下方各節連結。

事前準備

  • 如果您對雲端硬碟標籤還不熟悉,請參閱「管理雲端硬碟標籤」,進一步瞭解這類標籤的運作方式和建立方法。
  • 為貴機構啟用標籤功能:
    1. 登入 Google 管理控制台

      請使用「管理員帳戶」(結尾「不是」@gmail.com) 登入。

    2. 在管理控制台中,依序點選「選單」圖示  接下來 「應用程式」接下來「Google Workspace」接下來「雲端硬碟與文件」。
    3. 按一下 [標籤]
    4. 啟用標籤。
    5. 按一下「儲存」
  • 為獲得最佳效果,請為指定的標籤人員建立配置群組,將他們與機構中的其他群組分開。如需操作說明,請參閱「使用配置群組自訂服務設定」。

設定訓練

建立分類標籤

分類標籤是 AI 模型完成訓練後,自動為機密雲端硬碟檔案套用的標籤。建議您使用標記標籤來建立分類標籤,這樣在文件中會較為顯眼。如要進一步瞭解標記標籤,請參閱「以雲端硬碟標籤管理員身分開始使用」。

檔案標題旁邊會顯示標記標籤

標記標籤必須符合下列規定,才能做為分類標籤:

  • 只能有一個欄位,且需符合「選項清單」的欄位類型
  • 最少需有 2 個選項,最多 4 個
  • 必須完成發布

如果現有的標記標籤符合上述規定,即可做為分類標籤使用。否則,請按照這些步驟選擇標記標籤選項。

建立訓練標籤

建議您在選取標籤時 (下一個步驟) 建立訓練標籤,因為這樣可以自動建立訓練標籤,確保任何必要屬性都與分類標籤相符。

如果您選擇在選取標籤前建立訓練標籤,請注意以下事項:

  • 確認標籤符合必要的標籤條件
  • 將訓練標籤標上「訓練」字樣,方便您信任的標籤人員在訓練期間辨識並套用標籤。
  • 為訓練標籤新增說明欄位,進一步協助信任的標籤人員瞭解用途。

選取標籤並啟用訓練功能

  1. 登入 Google 管理控制台

    請使用「管理員帳戶」(結尾「不是」@gmail.com) 登入。

  2. 在管理控制台中,依序點選「選單」圖示  接下來 「安全性」接下來「存取權與資料控管」接下來「資料分類」
  3. 在 Google 雲端硬碟的「AI 分類」中,按一下「設定訓練」
  4. 在「選取分類標籤」部分,按一下「選取標籤」
  5. 選取您在上方「建立分類標籤」一節建立的標記標籤。
  6. 在「選取訓練標籤」部分,點選「建立訓練標籤」

    系統會自動建立與分類標籤屬性相同的訓練標籤。

  7. 按一下「更新標籤權限」,確保指定的標籤人員可以使用新標籤。標籤管理工具隨即會在另一個分頁中,以編輯模式開啟標籤。

    注意:您也可以日後再設定標籤權限。不過,請務必確保只有標籤人員能存取訓練標籤。

  8. 依序按一下「權限」下一步「編輯」,然後為標籤人員所在的配置群組授予「可套用標籤及設定標籤值」權限。
  9. 按一下「儲存」,然後關閉「標籤管理工具」分頁。

    分類標籤和訓練標籤皆選取完畢後,「啟用訓練功能」按鈕就會啟用。

  10. 點選「啟用訓練功能」

    重要事項:如果您在嘗試啟用訓練功能時收到錯誤訊息,代表分類標籤和訓練標籤不相符。請詳閱下方的標籤規定,等確認標籤符合所有規定後,再啟用訓練功能。

啟用訓練功能後,「資料分類」頁面會顯示您選取的訓練標籤和分類標籤。

  • 分類標籤會顯示「尚未就緒」。待訓練完成後,標籤狀態就會變更為「已就緒」
  • 「自動套用狀態」會顯示「為所有人關閉」。當分類標籤的狀態顯示為「已就緒」後,您就可以將「自動套用狀態」變更為「開啟」

接下來,指定的標籤人員就需開始為機密檔案套用訓練標籤了。

訓練模型

為了成功訓練 AI 模型,指定的標籤人員必須針對每個選項,至少為 100 個檔案加上標籤。舉例來說,假設標籤有 3 個選項,則總共至少應有 300 個檔案套用該標籤。AI 模型每 1 至 2 週會檢查一次訓練成果,如果每個標籤選項都有超過 100 個樣本,就會顯示「已就緒」進一步瞭解高品質樣本

在訓練期間,您可以查看已加上標籤的檔案數量,以及模型準確率的改善情形。

注意:訓練檔案的總上限為 100 萬個。

如要在訓練期間查看進度,請按照下列步驟操作:

  1. 在管理控制台中,依序點選「安全性」下一步「資料分類」
  2. 點選「查看模型詳細資料」
    • 在「訓練用標籤」部分,「訓練用檔案」會顯示每個選項已有多少檔案加上標籤。
    • 每個標籤選項都有一個分數,顯示模型在自行測試後,正確分類的訓練樣本百分比。
      • 低:低於 50%。表示模型尚未就緒,需要更詳盡的資料。
      • 中:50 到 80%。代表模型可能只在特定情況下準備就緒。
      • 高:超過 80%。表示模型已準備就緒,可為貴機構分類檔案了。

啟用自動套用標籤功能

將 AI 模型訓練到高度準確之後,即可選擇標籤選項並啟用自動套用功能。步驟如下:

  1. 在管理控制台中,依序點選「安全性」下一步「資料分類」
  2. 在「AI 分類」中,確認「分類標籤」的狀態顯示為「已就緒」
  3. 按一下「查看模型詳細資料」
  4. 在「分類標籤」部分,找出要允許 AI 模型自動套用的標籤選項,然後勾選旁邊的方塊。
  5. 按一下「啟用自動套用功能」
  6. 搜尋並選取所需的機構單位或群組,以便納入要自動套用標籤的使用者成員。舉例來說,如果您選取「財務」群組,就可以選取要為「財務」群組設定的標籤。
  7. 按一下「開啟 - 自動套用標籤」

    「開啟」選項下方會列出標籤的套用方式選項。

  8. 按一下「儲存」
  9. 在「資料分類」主頁面上,將規則的「自動套用狀態」變更為「開啟」

AI 分類功能何時會掃描檔案?

對於已啟用自動套用功能的使用者和共用雲端硬碟,AI 分類功能會至少掃描一次靜態檔案。在首次啟用自動套用功能後,這項程序可能需要 1 到 2 週的時間才能完成。

AI 分類功能也會在檔案上傳或修改時掃描檔案。套用的標籤可能會隨著檔案內容變更而變動。

監控雲端硬碟記錄中的 AI 分類標籤事件

您可以查看雲端硬碟記錄中的事件,詳細瞭解 AI 分類功能如何為檔案加上標籤。

  1. 依序點選「安全性」下一步「資料分類」
  2. 在 Google 雲端硬碟的「AI 分類」中,按一下「查看模型詳細資料」
  3. 按一下「查看記錄」

    安全調查工具會在新分頁中開啟,顯示下列兩項 AI 分類相關事件的雲端硬碟記錄搜尋結果:「已套用標籤」和「已變更標籤欄位值」

  4. 按一下事件「說明」,查看其他詳細資料,例如:
    • 已加上標籤的文件名稱和類型
    • 指派給文件的標籤欄位值 (例如「機密」或「受限」,如果這些是您的標籤選項的話)。

停用自動套用標籤功能

您可以停用所有標籤的自動套用功能,也可以只停用特定選項。

  1. 依序點選「安全性」下一步「資料分類」
  2. 在 Google 雲端硬碟的「AI 分類」中,按一下「查看模型詳細資料」
    • 在「分類標籤」部分,取消勾選「自動套用」欄中的「允許」,即可暫停自動套用該選項。
    • 如要完全暫停自動套用,請取消勾選所有選項。
為特定機構單位或群組全面停用自動套用功能

如果您要對特定機構單位/群組內使用者擁有的內容,全面停用自動套用功能,請使用這個選項。

  1. 依序點選「安全性」下一步「資料分類」
  2. 在 Google 雲端硬碟的「AI 分類」中,按一下「查看模型詳細資料」
  3. 按一下「管理自動套用功能」
  4. 按一下左側的機構單位或群組即可選取。
  5. 在「管理 AI 自動套用功能」中,按一下「關閉」

重設模型

在某些情況下,您可能需要重設模型,比方說是為了啟動另一項測試,或是因為模型準確度並未提升。如需重設模型,請注意下列事項:

  • 如果您重設模型,請等到模型訓練完成,AI 分類功能才能啟用新的分類標籤並套用至檔案上。
  • 先前套用的訓練標籤仍會保留在檔案中。您可以在重設模型後,選擇設定新模型,使用相同 (或不同) 的訓練標籤。
  • 重設模型後,自動套用的標籤仍會保留在檔案中。
  • 如果您為新模型選擇相同的分類標籤,AI 分類功能會忽略並覆寫先前模型的預測結果。這樣一來,您就可以使用模型,將貴機構的雲端硬碟檔案設為「重新處理」。如果您在初次部署後曾大幅提升模型品質,這個方法就很有用。
  1. 依序點選「安全性」下一步「資料分類」
  2. 在 Google 雲端硬碟的「AI 分類」中,按一下「查看模型詳細資料」
  3. 在 AI 模型詳細資料頁面的「動作」部分,按一下右側的「重設模型」

    「重設模型」對話方塊會列出重設模型帶來的影響。

  4. 如要繼續,請按一下「重設模型」

    AI 分類功能會重設為初始狀態。請按一下「設定訓練」,然後選擇新的分類和訓練標籤,從頭開始操作。

常見問題

全部展開  |  全部收合

訓練標籤和分類標籤需要符合哪些規定?

分類標籤和訓練標籤都必須符合下列條件:

  • 選項清單或徽章欄位類型皆只包含一個欄位。
  • 最少需有 2 個選項,最多 4 個。
  • 在每個標籤中以相同的順序顯示選項。舉例來說,如果分類標籤的選項順序如下:
    • 1. 選項 1
    • 2. 選項 2
    • 3. 選項 3

    訓練標籤選項的順序就不能像下面這樣:

    • 1. 選項 2
    • 2. 選項 1
    • 3. 選項 3
  • 已發布標籤。
  • 為標籤設定不同的存取權。訓練標籤應僅供可信任的指定標籤人員用於訓練模型。分類標籤的存取權設定則可較廣。
我可以使用分類標籤做為訓練標籤嗎?
不行。分類標籤與訓練標籤不得相同。標籤一經選做分類標籤,就不會顯示為訓練標籤選項。
哪些檔案適合用於訓練模型?

為確保訓練模型時能獲得最佳結果,請指示信任的標籤人員遵守下列規範來選擇訓練檔案:

  • 確保每個檔案至少有 500 個文字字元。
  • 所選檔案需盡可能忠實反映使用者在貴機構中建立、共用和使用的內容
  • 每個標籤選項所選的檔案數量需大致相同,且各選項至少要有 100 個檔案。這有利於模型全面解讀資料,進而提高分數。
  • 每種選項類型都要納入具代表性的檔案。舉例來說,如果合約在貴機構也是常見的「最高機密」檔案類型,「最高機密」標籤的 100 份檔案樣本就不能全是履歷檔案。
AI 分類功能是否只能用於為機密內容加上標籤?
雖然 AI 分類功能的主要重心是在機密內容,但只要標籤的選項不超過 4 個,在訓練後也能自動加上標籤。
模型可以使用多種語言訓練嗎?
這個模型支援多種語言,但請注意,訓練資料中的每種選項類型和語言,應包含各種具代表性的檔案。這麼做會增加成功訓練模型所需的檔案數量。目前尚不支援沒有字詞邊界的書寫系統,例如日文和中文。
分數的計算方式為何?
在訓練期間,AI 模型會使用 75% 的輸入資料自我訓練,學習如何為檔案加上標籤,並保留 25% 的資料用於定期測試成效。也就是說,模型在分析這 25% 的檔案時,會將其視為不清楚套用何種標籤,但其實這些檔案皆已加上標籤。接著,模型會自行選擇標籤,並將這個標籤與指定標籤人員套用的實際標籤比較。最後,在保留的檔案中,有多少比例的檔案已分配到正確的標籤,就是分數的計算依據。
停用自動套用選項會有甚麼影響?
掃描期間,如果AI 分類功能預測檔案會有停用自動套用功能的選項,就不會為該檔案套用標籤或欄位值。

先前加上 AI 分類標籤的檔案,即使這個選項已停用,仍會保留已套用的標籤和選項值。

AI 分類功能修改自動套用標籤的方式及時機為何?

建立模型並啟用自動套用功能後,AI 分類功能會掃描並分類所有可擷取足夠文字的靜態檔案。系統會至少掃描這些檔案一次。

如果內容經過修改,AI 分類功能會定期重新處理檔案。內容變更可能會導致檔案出現不同的預測結果。如果 AI 分類功能針對某個檔案具備現有選項和新預測選項,系統會優先採用選項清單中優先順序較高的選項。假設某個欄位在標籤管理工具中列有三個選項:

  • 機密
  • 內部
  • 公開

假設 AI 分類功能將檔案歸類為「內部」,而在內容變更後,AI 分類模型預測為「機密」。這時檔案的分類就會變更為「機密」。不過,如果 AI 分類模型預測為「公開」,檔案的分類仍會保持為「內部」

AI 分類不會修改使用者已審查或修改過的自動套用標籤和欄位值。

分類檔案時,在 AI、資料遺失防護規則和預設分類等多種分類機制中,系統會優先採用哪種機制?
資料分類會按照以下順序完成:
  1. 沒有使用者覆寫的資料遺失防護規則
  2. 手動分類
  3. 使用者覆寫的資料遺失防護規則
  4. AI 分類
  5. 預設分類
移除標籤或欄位可讓層級較低的分類機制生效。舉例來說,如果使用者移除含有標籤的檔案,之後依然可以透過 AI 分類功能自動套用相同標籤。
可套用標籤的檔案類型是否有任何限制?
  • 您可以為雲端硬碟中任何項目加上標籤。編輯器應用程式也具備原生標籤功能。
  • AI 分類功能與雲端硬碟資料遺失防護功能相同,採用可建立索引的文字處理技術。凡是能從雲端硬碟擷取出可建立索引文字的檔案,都可以使用 AI 分類功能評估是否要套用標籤。我們無法從每個檔案擷取可建立索引的文字,因此無法保證 AI 分類功能可以處理每個檔案。
  • 如要使用 AI 分類功能,檔案必須達到最低文字門檻,系統才能判定分類。因此,系統可能不會分類某些檔案 (例如:非常短的文件和文字很少的圖片)。
對於沒有合格授權的使用者,這項功能會如何運作?
只要網域中的部分使用者擁有支援 AI 分類功能的有效授權,管理員就能訓練模型。凡是標有訓練標籤的檔案,只要使用者具備支援雲端硬碟標籤功能的授權,就能擁有這類檔案。自動套用功能只會套用至具備支援 AI 分類授權的使用者所擁有的檔案。如果擁有檔案的使用者沒有支援授權,AI 就不會處理這類檔案。

相關主題

以雲端硬碟標籤管理員身分開始使用

這對您有幫助嗎?

我們應如何改進呢?
搜尋
清除搜尋內容
關閉搜尋
主選單
11452577303419018925
true
搜尋說明中心
true
true
true
true
true
73010
false
false