內容篩選

內容篩選指的是使用自動系統來處理大量資料,並對符合某些條件的任何內容採取行動。發佈商通常會使用文字和媒體篩選解決方案,處理站上大量的使用者產生內容。這類系統的常見用途是篩選特定內容,例如分享成人及違法檔案,以及銷售槍枝、毒品、酒精飲料和菸草。

重要注意事項:違規內容未必是由本機代管。即使是連結到代管違規內容的外部來源,也算是違規。舉例來說,像是由發布商以頁框形式提供,但由第三方網站非法代管的電影就違反了《Google 發布商政策》。

開發內部解決方案

許多發布商都選擇自行開發篩選系統,這種做法的好處如下:

  • 文字篩選系統的編碼相對來說較容易
  • 費用通常比商業解決方案低廉
  • 發布商最瞭解本身網站和使用者,而且比任何人更能預測政策問題
自行開發文字型解決方案時,不妨參考以下幾個提案和建議。

 

建立關鍵字清單
若要篩選文字,系統必須使用由個別文字及文字組合所構成的關鍵字清單。視內容類型、站上內容量以及發布商的可用資源而定,有很多種方式可以建立這份清單:
  • 將您想要篩選的文字和詞組列成清單。您可以憑直覺加入字詞,也可以透過其他資源尋找靈感:
    • 由員工集思廣益
    • 向使用者尋求協助
    • 使用 Google Ads 的關鍵字規劃工具
    • 如需更多靈感,您也可以查看代管不適宜內容的網站 (例如成人及/或檔案分享網站),瞭解這些網站上經常出現哪些關鍵字。
  • 編寫自動關鍵字擷取工具的程式碼:
    • 使用搜尋引擎資料瀏覽站上所有網頁
    • 在站上擷取個別文字和文字組合的清單
    • 保留最常用的關鍵字並移除其他關鍵字。別忘了剔除「a」、「and」或「the」等常見冠詞和單字。
    • 存成文字檔案
    • 對任意數量的網站重複上述步驟,直到您認為清單沒問題為止,這樣就大功告成了。
    • 重要注意事項:擷取其他網站並將其內容做為己用,這不但違反《Google 發布商政策》和《Google 網站管理員指南》,還可能違法且/或違反道德。
分配權重

字詞並非生而平等,有些關鍵字可能比其他關鍵字更不適宜。因此,建議您對不同字詞指定不同權重。

舉例來說,英文版成人篩選器對「porno」(色情) 這個字的權重應高於「sex」(性)。「porno」幾乎專指非闔家皆宜內容,但「sex」根據上下文也可能是指「性別」。

此外,您還可想想本身沒有問題,但與其他字眼組合後可能另有所指的詞。舉例來說,「圖片」這個詞本身並無不妥,但「幼齒圖片」通常與色情有關。

篩選程序
處理內容篩選有兩種常用的方法,發布商可各自決定哪一種最適合自家網站。

方法 1 - 掃描網頁上顯示的使用者自製內容:

  1. 掃描內容
  2. 標記符合篩選條件的內容
  3. 在代管這類內容的網頁上暫停放送廣告
  4. 手動審核內容:
    1. 如果內容安全,則恢復放送廣告並調整篩選器
    2. 如果內容不安全,則確認內容未顯示在包含廣告程式碼的網頁上

方法 2 - 向他人顯示使用者自製內容前先進行掃描:

  1. 掃描內容
  2. 標記符合篩選條件的內容
  3. 排定審核或直接拒絕
  4. 手動審核內容:
    1. 如果內容安全,在廣告放送網頁上顯示內容並調整篩選器
    2. 如果內容不安全,停用廣告放送並顯示或拒絕內容

商業解決方案概述

有些服務可提供內容篩選功能,也有些服務專門篩選成人或版權等類型的內容。此外,對於希望上網輕鬆致富的發佈商和使用者,有些群眾外包平台也在兩者之間搭起橋樑。做決定時,最好的方法就是針對主題進行市場研究,據此判斷哪一種解決方案最適合您提供的服務。建議您搜尋軟體評論網站,瞭解哪幾種使用者產生內容篩選系統深受推薦。掌握這些資訊後,您就能根據產品的分數、其獨特功能以及定價模式來決定最適合的解決方案。

這對您有幫助嗎?
我們應如何改進呢?