AI 分類を使用した Google ドライブファイルの自動ラベル付け

この機能でサポートされているアドオン: Gemini Enterprise と AI Security。 アドオンを比較する

重要: AI 分類は 2024 年 4 月 9 日をもってベータ版の段階を終了しました。管理コンソール上のベータ版ラベルが削除されるまでには 2～3 週間かかります。

AI 分類は、AI を使用して自動的に組織の機密コンテンツにラベルを付ける機能です。最初のトレーニング期間（AI モデルが機密コンテンツに関する組織の基準を学習する期間）を終えると、AI 分類によってドライブ内の新しいファイルと既存のファイルの両方にラベルが自動的に適用されるようにできます。

AI 分類の使用を開始する方法は次のとおりです。

1）トレーニングを設定する: まず、分類ラベルを作成します。トレーニングが完了すると、AI モデルによってこのラベルがファイルに自動的に適用されるようになります。続いてトレーニングラベルも作成します。このラベルは分類ラベルとほぼ同じものです。

2）モデルをトレーニングする: トレーニング期間（通常およそ 1 週間）に、ラベル付け担当者（機密ファイルを評価できる組織内のユーザー）がトレーニングラベルを使ってドライブ内のファイルの分類を開始します。これらのサンプルをもとに、モデルは機密ファイルを同様に分類する方法を学習し始めます。

3）自動分類をオンにする: （およそ 1 週間後に）モデルのトレーニングが終わると、自動分類をオンにするよう求められます。分類されたファイルの数と精度は継続的にモニタリング可能です。

各フェーズの詳細については、以下のリンク先のセクションをご覧ください。

始める前に

ドライブのラベルについてよくわからない場合は、ドライブのラベルの管理についての記事で、ラベルの仕組みと作成方法の詳細をご確認ください。
組織に対してラベルを有効にします。
1. Google 管理コンソールにログインします。
  管理者アカウント（末尾が @gmail.com でないもの）でログインします。
2. 管理コンソールで、メニューアイコン [アプリ] [Google Workspace] [ドライブとドキュメント] にアクセスします。
3. [ラベル] をクリックします。
4. ラベルをオンにします。
5. [保存] をクリックします。
ラベル付け担当者用に組織内の残りのユーザーとは別の設定グループを作成することで、最適な結果が得られます。手順については、設定グループを使用してサービスの設定をカスタマイズするをご覧ください。

トレーニングを設定する

分類ラベルを作成する

分類ラベルは、トレーニング完了後に AI モデルによってドライブ内の機密ファイルに自動的に適用されるラベルです。おすすめは、ドキュメント上で目立つバッジラベルを使用することです。バッジラベルについて詳しくは、ドライブのラベル管理者としての作業を開始するをご覧ください。

バッジラベルはファイルタイトルの隣に表示されます。

分類ラベルとして使用する場合、バッジラベルは次の要件を満たす必要があります。

[オプションリスト] タイプのフィールドが 1 つだけである
オプションの数が 2～4 個である
公開する

これらの要件を満たすバッジラベルがすでにある場合は、それを分類ラベルとして使用できます。そのようなバッジラベルがない場合は、こちらの手順に沿ってバッジラベルオプションを選択します。

トレーニングラベルを作成する

トレーニングラベルを自動的に作成できる場合は、ラベルの選択（次のステップ）時に作成することをおすすめします。これにより、トレーニングラベルがすべての必要な点で分類ラベルと一致することが保証されます。

ラベルを選択する前にトレーニングラベルを作成する場合:

必要なラベルの条件をラベルが満たしていることを確認します。
トレーニングラベルに「トレーニング」という言葉を付けておけば、トレーニング期間中に信頼できるラベル付け担当者がそのラベルを認識し、適用しやすくなります。
トレーニングラベルに説明フィールドを追加しておくことで、信頼できるラベル付け担当者にそのラベルの目的を理解してもらいやすくなります。

ラベルを選択してトレーニングを有効にする

Google 管理コンソールにログインします。
管理者アカウント（末尾が @gmail.com でないもの）でログインします。
管理コンソールで、メニューアイコン [セキュリティ] [アクセスとデータ管理] [データ分類] にアクセスします。
Google ドライブの AI 分類で、[トレーニングの設定] をクリックします。
[分類ラベルの選択] で、[ラベルを選択] をクリックします。
上の分類ラベルを作成するで作成したバッジラベルを選択します。
[トレーニングラベルの選択] で、[トレーニングラベルを作成] をクリックします。
これにより、分類ラベルと同じ属性を持つトレーニングラベルが自動的に作成されます。
ラベル付け担当者が新しいラベルを使用できるようにするには、[ラベルの権限を更新] をクリックします。別のタブでラベルマネージャーの編集モードのラベルが開きます。
注: ラベルの権限は後で設定することもできます。ただし、トレーニングラベルにアクセスできるのはラベル付け担当者のみにすることが重要です。
[権限] [編集] をクリックして、ラベル付け担当者が含まれる設定グループに [ラベルの適用と値の設定が可能] 権限を付与します。
[保存] をクリックし、ラベルマネージャーのタブを閉じます。
分類ラベルとトレーニングラベルの両方を選択すると、[トレーニングを有効にする] ボタンが有効になります。
[トレーニングを有効にする] をクリックします。
重要: トレーニングを有効にしようとしたときにエラーメッセージが表示された場合は、分類ラベルとトレーニングラベルが一致していません。以下のラベルの要件を確認し、ラベルがすべての要件を満たしていることを確認してから、トレーニングを有効にしてください。

トレーニングを有効にすると、[データ分類] ページに、選択したトレーニングラベルと分類ラベルが表示されます。

分類ラベルに [まだ準備ができていない] と表示されている。トレーニングが完了すると、ラベルのステータスが [準備完了] に変わります。
[自動適用のステータス] が [オフ（すべてのユーザー）] になっている。分類ラベルのステータスが [準備完了] になったら、自動適用のステータスを [オン] に変更できます。

続いて、ラベル付け担当者が、機密ファイルへのトレーニングラベルの適用を開始する必要があります。

モデルをトレーニングする

AI モデルを正常にトレーニングするには、ラベル付け担当者が各オプションにつき少なくとも 100 ファイルにラベルを付ける必要があります。たとえば、ラベルに 3 つのオプションがある場合は、合計 300 以上のファイルにラベルを適用する必要があります。AI モデルは 1～2 週間ごとにトレーニングを確認し、各ラベルオプションにつきサンプル数が 100 件以上になると [準備完了] と表示されます。高品質のサンプルについての詳細もご確認ください。

トレーニング期間中は、ラベル付けされたファイルの数とモデルの精度の向上状況を確認できます。

注: トレーニングファイルの総数の上限は 100 万です。

トレーニング期間中の進捗状況を確認するには:

管理コンソールで、[セキュリティ] [データ分類] に移動します。
[モデルの詳細を表示] をクリックします。
- [トレーニングラベル] の [トレーニングファイル] に、オプションごとにラベル付けされたファイルの数が表示されます。
- 各ラベルオプションには、モデルがテスト後に正しく分類したトレーニングサンプルの割合を示す「スコア」が付いています。
  - 低 - 50% 未満。モデルにはより適切なデータが必要で、まだ準備ができていません。
  - 中 - 50～80%。モデルの準備が限定的に整っている可能性があります。
  - 高 - 80% 超。このモデルは組織のファイルを分類する準備が整っています。

ラベルの自動適用を有効にする

高レベルの精度を実現できるように AI モデルをトレーニングしたら、ラベルオプションを選択してラベルの自動適用を有効にできます。手順は次のとおりです。

管理コンソールで、[セキュリティ] [データ分類] に移動します。
[AI 分類] で、[分類ラベル] のステータスが [準備完了] になっていることを確認します。
[モデルの詳細を表示] をクリックします。
[分類ラベル] で、AI モデルに自動適用を許可するラベルオプションのチェックボックスをオンにします。
[自動適用を有効化] をクリックします。
ラベルを自動的に適用するユーザーメンバーが含まれている組織部門またはグループを検索して選択します。たとえば、「財務」というグループを選択し、次にその「財務」グループに対して設定するラベルを選択します。
[オン - ラベルの自動適用] をクリックします。
[オン] オプションの下に、ラベルの適用方法に関するオプションが表示されます。
[保存] をクリックします。
[データ分類] のメインページで、ルールの [自動適用ステータス] が [オン] に変わります。

ドライブのログに記録された AI 分類ラベルのイベントをモニタリングする

ドライブのログに記録されたイベントを確認することで、AI 分類によるファイルのラベル付けについての詳細を確認できます。

[セキュリティ] [データ分類] に移動します。
Google ドライブの AI 分類で、[モデルの詳細を表示] をクリックします。
[ログを表示] をクリックします。
新しいタブでセキュリティ調査ツールが開き、[ラベルの適用] と [ラベルフィールドの値の変更] という AI 分類関連の 2 つのイベントに関するドライブのログの検索結果が表示されます。
イベントの [説明] をクリックすると、次のような詳細情報が表示されます。
- ラベル付けされたドキュメントの名前と種類
- ドキュメントに割り当てられたラベルフィールドの値（例: ラベルオプションである場合は [機密] や [制限付き] など）。

ラベルの自動適用を無効にする

すべてのラベルまたは一部のオプションに対する自動適用を無効にできます。

[セキュリティ] [データ分類] に移動します。
Google ドライブの AI 分類で、[モデルの詳細を表示] をクリックします。
- [分類ラベル] で、[自動適用] 列の [許可] をオフにして、そのオプションの自動適用を停止します。
- 自動適用を完全に停止するには、すべてのオプションのチェックボックスをオフにしてください。

特定の組織部門またはグループに対して自動適用を完全に無効にする

特定の組織部門またはグループのユーザーが所有するコンテンツに対して自動適用を完全に無効にする場合は、このオプションを使用します。

[セキュリティ] [データ分類] に移動します。
Google ドライブの AI 分類で、[モデルの詳細を表示] をクリックします。
[自動適用を管理] をクリックします。
左側で組織部門またはグループをクリックして選択します。
[AI による自動適用の管理] で [オフ] をクリックします。

モデルをリセットする

ある時点で、モデルのリセットが必要になることがあります（たとえば、別のテストを開始する場合や、モデルの精度が向上しない場合など）。モデルをリセットする必要がある場合は、次の点に注意してください。

モデルをリセットした場合、新しい分類ラベルを有効にしてファイルに自動的に適用するには、モデルのトレーニングが完了するのを待つ必要があります。
以前に適用したトレーニングラベルはファイルに残ります。モデルのリセット後、同じトレーニングラベル（または別のトレーニングラベル）を使用するように新しいモデルを構成できます。
自動的に適用されたラベルは、リセット後もファイルに残ります。
新しいモデルに同じ分類ラベルを選択すると、以前のモデルの予測は無視され、上書きされます。このように、モデルのリセットを使用して組織のドライブコーパスを「再処理」できます。この機能は、最初のデプロイ以降にモデルの品質を大幅に改善した場合に便利です。

[セキュリティ] [データ分類] に移動します。
Google ドライブの AI 分類で、[モデルの詳細を表示] をクリックします。
AI モデルの詳細ページで、右側の [アクション] の下にある [モデルをリセット] をクリックします。
[モデルをリセット] ダイアログに、モデルのリセットによる影響が一覧表示されます。
続行するには、[モデルをリセット] をクリックします。
AI 分類が初期状態にリセットされます。再起動するには、[トレーニングの設定] をクリックして、新しい分類ラベルとトレーニングラベルを選択します。

よくある質問

トレーニングラベルと分類ラベルにはどのような要件がありますか？

分類ラベルとトレーニングラベルは、どちらも次の条件を満たす必要があります。

[オプションリスト] タイプのフィールドが 1 つだけである
オプションの数を 2～4 個にする
2～4 個のオプションの順序は各ラベルで同じである必要があります。たとえば、分類ラベルに次の順序でオプションがあるとします。
- 1. オプション 1
- 2. オプション 2
- 3. オプション 3
トレーニングラベルのオプションを次のように並べることはできません。
- 1. オプション 2
- 2. オプション 1
- 3. オプション 3
両方のラベルを公開する必要がある。
ラベルに別のアクセス権限を設定する必要があります。トレーニングラベルを使用できるのは、モデルのトレーニング担当として信頼されているラベル付け担当者のみにする必要があります。分類ラベルへのアクセス権限はもっと広範に設定できます。

分類ラベルをトレーニングラベルとして使用することは可能ですか？

いいえ。分類ラベルとトレーニングラベルは分ける必要があります。分類ラベルとして選択したラベルは、トレーニングラベルの選択肢として表示されません。

モデルのトレーニングに適しているのはどのようなファイルですか？

モデルのトレーニングで最良の結果を得るには、信頼できるラベル付け担当者がトレーニングファイルを選択する際に、次のガイドラインに沿ってもらうようにしてください。

各ファイルの文字数を 500 文字以上にする。
組織内でユーザーが作成、共有、使用する実際のコンテンツを最もよく表すファイルを選択する。
各ラベルオプションで選択するファイルをほぼ同数にする。各オプションにつき少なくとも 100 ファイルを選択します。こうすることで、モデルがデータを包括的に理解しやすくなり、スコアが向上します。
オプションのタイプごとに代表的な各種ファイルを含める。たとえば、契約書も組織内で一般的に機密扱いになっているのであれば、100 通の履歴書のみを機密ファイルの代表例とすることは避けてください。

AI 分類が機能するのは機密コンテンツのラベル付けのみですか？

主要な機能は機密コンテンツのラベル付けですが、付いているオプションが 4 つまでのラベルであればどれでも、自動ラベル付け用にトレーニングできます。

スコアはどのように算出されるのですか？

トレーニング中、AI モデルは入力データの 75% を使用してファイルのラベル付け方法を自己トレーニングし、残りの 25% は定期的に自身のパフォーマンスをテストするために確保します。つまり、ラベル付きファイルの 25% については、どのラベルが適用されているのかを知らないかのようにファイルを分析します。次に、独自のラベル選択を行い、ラベル付け担当者によって適用された実際のラベルと比較します。スコアは、リザーブされているファイルのうち適切なラベルが正しく割り当てられた割合を示しています。

AI がラベルを付けたファイルの総数はどのように計算されますか？

ファイルを [AI がラベルを付けたファイル] のファイル合計数にカウントするには、そのファイルが AI 分類によって自動的にラベル付けされていて、その後にユーザーが編集や承認を行っていないことが条件です。たとえば、モデルによってファイルが機密として自動的にラベル付けされ、そのラベルに対してそれ以上のアクション（ユーザーがラベルを承認、変更、削除するなど）が行われなかった場合、そのファイルは AI がラベル付けした合計数にカウントされます。ユーザーがラベルを承認した場合や、最初の AI 分類後に機密ラベルを「内部」に変更した場合、そのファイルは [AI がラベルを付けたファイル] の総数に含まれなくなります。

AI 分類の仕組みはどこで確認できますか？

データ分類に対する Google のアプローチと、ドライブの AI 分類の仕組みについて詳しくは、Google Workspace の AI 分類に関するホワイトペーパーをご覧ください。

この情報は役に立ちましたか？

改善できる点がありましたらお聞かせください。

AI 分類を使用した Google ドライブファイルの自動ラベル付け

始める前に