コンテンツ ポリシー

コンテンツ フィルタリング

コンテンツ フィルタリングとは、大量のデータを処理し、特定の条件に一致するコンテンツを操作するための自動システムです。サイト運営者様は通常、テキストやメディアのフィルタリング ソリューションを利用してユーザーが作成した大量のコンテンツを管理します。多くの場合、アダルト関連や違法なファイル共有、銃火器、麻薬、アルコール類、タバコなどのコンテンツの除外に利用されます。

重要: 違反コンテンツはローカル以外でホストされているものも含まれます。違反コンテンツをホストしている外部ソースへのリンクも違反とみなされます。たとえば、サードパーティのサイトで違法にホストされている動画をフレーム処理した場合、AdSense ポリシーに違反していることになります。

自社ソリューションの開発

多くのサイト運営者様は、独自のフィルタリング システムを開発しています。この場合、次のようなメリットがあります。

  • テキスト ベースのフィルタリングの開発は比較的簡単です。
  • 多くの場合、商用ソリューションよりも費用を大幅に抑えることができます。
  • サイトとユーザーのことを最も熟知しているのはサイト運営者様であり、ポリシーに関する問題を誰よりも的確に予測できます。
独自のテキスト ベースのソリューションを開発するうえで役立つアイデアとヒントは次のとおりです。

キーワード リストを作成する
テキストをフィルタリングするには、単語やフレーズから成るキーワード リストが必要です。キーワード リストは、コンテンツのタイプ、サイトの規模、サイト運営者様が利用できるリソースに応じて次のいくつかの方法で作成できます。
  • 除外する単語やフレーズをリストにします。キーワード選びには独自の直感のほか、次のように協力を得ることもできます。
    • スタッフに協力を求める
    • ユーザーに協力を求める
    • Google 広告のキーワード ツールを使用する
    • さらにヒントを得るには、不適切なコンテンツ(アダルト関連のサイトやファイル共有サイトなど)をホストするウェブサイトを閲覧し、どのようなキーワードが多く使用されているかを確認する
  • 次のような独自のキーワード抽出ツールをプログラミングします。
    • 検索エンジンのデータを基にサイトの全ページを調べる。
    • サイト独自の単語やフレーズのリストを取得する。
    • もっともよく使われているキーワードを残し、それ以外は除外する。助詞や助動詞などの機能語も忘れずに除外してください。
    • テキスト ファイルに出力する。
    • 満足いくリストができるまで、複数のサイトで上記の操作を繰り返す。
    • 重要: 他のサイトからコンテンツを抽出し、独自のコンテンツとして使用することは、Adsense ポリシーや Google ウェブマスター向けガイドラインに違反します。また、違法行為や不正行為とみなされることもあります。
重み付け

すべての語句は同等ではありません。中には悪質なキーワードもあります。そのため、語句ごとに異なる重み付けをすることをおすすめします。

たとえば、アダルト コンテンツ用のフィルタの場合、「ポルノ」は「性」よりも重みを大きくします。「ポルノ」に関連するコンテンツはほぼ例外なく一般向けではありませんが、「性」はコンテンツによっては「性別」など一般的な意味で使用されることもあります。

また、その単語だけでは問題がなくても他の単語と組み合わせるとまったく別の意味になる単語にも気を付けます。たとえば「画像」だけではまったく問題ありませんが、「少女 画像」ではポルノである可能性が高くなります。

フィルタリングのプロセス
コンテンツ フィルタリングを使用する場合の一般的なアプローチ方法は次の 2 通りです。どちらのアプローチがサイトに有用であるかをご検討ください。

方法 1 - ユーザーが作成したコンテンツがページに表示されてからスキャンする

  1. コンテンツをスキャンする
  2. フィルタリングの条件に一致するコンテンツがある場合は報告する
  3. 該当のコンテンツをホストしているページの広告掲載を無効にする
  4. 個別にコンテンツを審査する
    1. コンテンツに問題がない場合、広告掲載を有効にしてフィルタを調整する
    2. コンテンツに問題がある場合、広告コードが配置されているページにそのコンテンツが表示されないようにする

方法 2 - ユーザーが作成したコンテンツがユーザーに表示される前にスキャンする

  1. コンテンツをスキャンする
  2. フィルタリングの条件に一致するコンテンツがある場合は報告する
  3. 審査の対象に入れるか、即座に却下する
  4. 個別にコンテンツを審査する
    1. コンテンツに問題がない場合、広告掲載ページにコンテンツを表示し、フィルタを調整する
    2. コンテンツに問題がある場合、広告掲載を無効にしてコンテンツを表示するか却下する

商用ソリューションについて

コンテンツ フィルタリング サービスは多数あり、中にはアダルト コンテンツや著作権で保護されたコンテンツのような特定のタイプのフィルタリングに特化したサービスもいくつかあります。また、サイト運営者様とインターネットで簡単に金儲けをしようとするユーザーとを結び付けるクラウドソーシング プラットフォームもあります。この場合に最適な方法は、トピックについて市場調査を行い、提供するサービスに最適なソリューションを決定することです。ソフトウェアの評価サイトで、ユーザーが作成したコンテンツをフィルタリングするおすすめのシステムをぜひご確認ください。このような情報をすべて収集したら、製品の評価や独自の機能、価格を基に最適なソリューションを選びます。

この情報は役に立ちましたか?
改善できる点がありましたらお聞かせください。