Google 運用電腦演算法檢索新聞網站。為了協助系統判斷真正的新聞報導網頁,請確保您的網站遵守以下的技術相關規定。
網站結構需求
Google 新聞建議發布商遵循以下的網站結構相關規定,以便 Google 新聞能夠正確檢索新的內容。
永久版面網頁
如果您的主要新聞版面的網址經常更動,Google 新聞可能就無法解讀您的網站。網址如果不固定,我們就無法檢索新的內容,這是因為系統無法確認要檢索哪一個網址才能找到最新的內容。
為了方便自動檢索器 Googlebot-News 檢索新聞,建議您為網站的主要新聞版面採用固定網址。Googlebot-News 最適合用來檢索 HTML 連結,但無法檢索圖片連結或嵌入 JavaScript 的連結。因此,請確保您版面網頁上的報導僅包含 HTML 連結。
除此之外,錨定文字 (指向版面網頁中的新聞) 必須和報導標題與網頁標題相同。如果這些技術需求會造成問題,也許只檢索 Sitemap 就能解決問題。如果您想嘗試只利用 Sitemap 檢索網站,請與我們的小組聯絡。
可存取的內容
我們的檢索器必須存取您的網站,才能將您的內容納入 Google 新聞。請確認 robots.txt 檔案並未封鎖您報導所在的目錄,而且中繼標籤或標頭規格並未禁止我們存取您的報導連結。Google 新聞與 Google 網頁搜尋服務都是透過 Googlebot 漫遊器來檢索內容。
-
如果您認為自家網站的 robots.txt 檔案、中繼標記或 HTML 標頭規格可能造成檢索器遭到封鎖,請前往說明中心參閱管理對您網站上內容的存取權限。
語言和編碼方面的需求
請務必瞭解我們對於內容語言和網站編碼的相關規定。
語言
Google 新聞不會顯示在單篇報導中使用多種語言的網站。我們的系統無法分析包含多種語言的內容,因此難以確保我們會以正確的語言顯示內容。
如果您的網站包含採用特定語言的版面 (例如 example.com/french 和 example.com/english),請分別為每種語言建立不同的出版品。這可以確保使用者會看到採用自己語言的內容。瞭解如何設定出版品。
為您的網站編碼
如要獲得最佳效果,請採用 UTF-8 為您的網站編碼。如要進一步瞭解編碼,請造訪 www.w3.org。
個別報導網頁的需求
為了避免檢索到新聞報導以外的內容,Google 新聞對於每個報導網頁都設有幾項要求。請依照下列步驟進行,以確保您遵守相關規定。
報導網址
報導網址不得重複且不能變動:
-
專屬網址:顯示報導全文的每個頁面都必須有專屬網址。如果網站以同一個網址顯示多篇報導,或是沒有為每篇報導提供專屬網頁連結,Google 新聞皆無法予以收錄。
- 永久網址:為確保我們的報導連結可順利運作,你的新聞網站上的每篇報導都必須有一個專屬的永久網址。舉例來說,假設 www.yoursite.com/news1.html 這個網頁每天顯示不同的報導,我們的系統就無法檢索這個網頁。
重要事項:請勿透過新網址重新發布新聞報導。
如果報導於日後重新發布,報導網址並不會改變。舉例來說,假設報導最初是透過 www.example.com/news1.html 發布,重新發布時網址並不會改至 www.example.com/news2.html。如果在更改網域或內容管理系統 (CMS) 結構的過程中,你的網址模式有所變更,請將模式轉換規則傳送給我們,我們可協助套用這些模式變更。
網頁版面配置的相關規定
請確保我們的自動檢索器能夠輕鬆地識別您報導的標題和發布時間。您的報導頁面必須採用 HTML 格式,且內文不能嵌入到 JavaScript 中。