SEO 最常見的索引問題以及如何解決

索引問題可能會使您的 SEO 努力無效,一個頁面可能已經完美優化並具有出色的用戶體驗,但如果 Google 沒有看到它,它就毫無價值可言。未編入索引的頁面不會進入自然搜尋結果(SERP),也不會帶來流量和轉化。反之亦然,如果 Google 偶爾會看到並索引一個不應該被索引的頁面,那麼您將面臨隱私資訊洩露、Google 對低品質內容的處罰,以及其他難以令人滿意的後果帶來的風險。在本篇文章中,我們的 SEO 專家將分享存在哪些類型的索引問題以及如何解決這些問題,以便它們存在於您網站以外的任何地方。但首先,讓我們看看如何檢查您的網站是否有任何索引問題。


如何發現索引問題?

Google Search Console 可以讓您基本但仍然充分了解您的網站存在哪些索引問題。無論出於何種原因未編入索引的頁面都放在一個部分下,名為網頁未編入索引的原因。已編入索引但仍有任何問題且需要您注意的頁面可以在網頁索引狀態中找到。Search Console 將向您顯示詳細資訊並幫助確定頁面的問題。一旦您需要更深入地挖掘並獲得有關如何修復以使頁面聽起來不錯的建議,請諮詢 SEO 專家關於索引和可抓取性部分:SEO 專家將收集所有有錯誤的 URL,因此您無需單獨手動檢查每個頁面。看看找到哪些類型的索引問題以及如何修復它們以保持您的網站被抓取和索引。我們將理所當然地認為所有報告受索引問題影響的 URL 都需要編入索引。如果不應將 URL 編入索引,請使用 noindex 標記阻止它或借助 robots.txt 說明限制訪問。此外,請確保從您的網站地圖中刪除這些頁面。如果它實際上沒有被編入索引,則什麼也不做。


01 未找到 (404)

未找到 (404) 或 URL 損壞可能是最常見的索引問題之一。出於多種原因,頁面可能具有 404 狀態代碼。比如說,您已經刪除了 URL,但沒有從網站地圖中刪除該頁面,或者錯誤地寫入了 URL 等等。正如 Google 所言,404 本身不會損害您的網站性能,直到這些是提交的 URL(即您明確要求 Google 索引的那些)。如果您在索引報告中看到 404 URL,以下是一些可能的選項,用於在它們不打算發生的情況下如何修復它們:更新您的網站地圖並檢查受影響的 URL 是否正確寫入。如果頁面已移至新地址,則設定 301 重定向。如果頁面在沒有任何替換或替代的情況下被刪除,則將其保留為 404,但將其從網站地圖中刪除。這樣, Google 就不會再試圖找到它並浪費抓取預算了。如果您需要保留 404,則設定一個自定義的用戶友好的 404 頁面,您可以在其中新增一些有用的連結,讓用戶留在您的網站上,而不僅僅是關閉頁面,用戶離開您的網站將會是您的損失。請記住,404 頁面仍然是 404,因此無論它有多好,Google 都不應該對其進行索引。值得注意,GSC 不會區分 404(未找到)和 410(已消失)並將它們放在一起在 404 報告下。這些曾經是不同類型的回應代碼:404 表示「未找到,但以後可以找到」,而 410 曾經代表「未找到,並且未來不會找到,因為它已經消失了」。

至於今天, Google 表示他們對待 404 和 410 是一樣的,所以如果你在 404 報告中找到 410 頁面,你可能不需要費心。我建議您做的唯一一件事是設定自定義 404 頁面而不是空的 410,以節省流量並防止用戶從您的網站跳出。許多 SEO 操作人員和網站管理員都有將 404 重定向到主頁的習慣,但事實上這並不是最佳做法。這樣做會讓 Google 感到困惑,並導致出現軟性 404 問題。好吧,讓我們看看這些軟性 404 是什麼。


02 軟性 404(Soft 404)

當頁面有 200 OK 回應但 Google 無法找到其內容並將其視為 404 時,就會發生軟性 404 (Soft 404)或稱轉址式 404 問題。軟性 404 可能出於多種原因發生,其中一些甚至可能不取決於您,例如用戶瀏覽器發生的錯誤。這裡還有一些原因,像是缺少伺服器端包含文件、與資料庫的連接斷開、一個空的內部搜索結果頁面、已卸載或丟失的 JavaScript 文件、內容太少、頁面隱藏等等。這些問題實際上並不難解決。以下是一些常見的場景:如果內容移動了,頁面實際 200 OK 但為空,則設定 301 重定向到新地址;如果刪除的內容別無選擇,則將其標記為 404 並從網站地圖中刪除;如果該頁面本來就存在,那麼新增一些內容並檢查其上的所有腳本是否正確呈現和顯示(未被 robots.txt 阻止,瀏覽器支持等);如果錯誤是因為 Googlebot 嘗試獲取頁面時伺服器關閉,請檢查伺服器是否正常工作。如果是,則請求重新索引此頁面。


03 由於未經授權的請求而被阻止 (401)

當 Googlebot 嘗試訪問需要授權的頁面時會發生 401 錯誤,而您的伺服器阻止了 Googlebot 這樣做。如果您希望將該頁面編入索引,請授予 Googlebot 相關權限,或刪除授權請求。


04 由於訪問被禁止而被阻止 (403)

當用戶代理提供憑據以進入頁面(帳號、密碼)但未被授予實際執行該操作的權限時,會發生此類錯誤。但是,Googlebot 從不提供憑據,因此伺服器返回 403 而不是預期的頁面。如果某個頁面被錯誤地阻止並且您確實需要將其編入索引,請允許未登錄用戶訪問,或明確允許 Googlebot 進入該頁面以對其進行讀取和索引。


05 提交的 URL 標記為 noindex

從名稱可以清楚地看出,當您明確要求 Google 為頁面編制索引(即,將其新增到網站地圖或手動要求編入索引)但該頁面具有 noindex 標記時,就會發生此錯誤。修復非常簡單,直接刪除 noindex 標籤,以便 Google 可以訪問該頁面。


06 被 robots.txt 屏蔽的 URL

如果您在 robots.txt 的幫助下屏蔽了某個網頁,那麼 Google 將不會抓取它。刪除限制以使頁面編入索引。注意: Robots.txt 不能保證該頁面不會被編入索引。這就是為什麼有時 Google Search Console 可能會顯示內容的原因。與未編入索引的頁面相比,此類問題可能會給您帶來更多問題,因為 Google 可能會訪問並披露原本不打算出現在 SERP 中的資訊(如購物車、私人數據等)。如果遇到這樣的問題,請決定是否需要將頁面編入索引。如果是這樣,請從 robots.txt 文件中刪除 URL。如果沒有,也將其從 robots.txt 中刪除,但應用 noindex 標籤,或限制非授權用戶的訪問。應用新限制後,您還可以要求 Google 通過 GSC 將頁面從索引中刪除。


07 無內容索引

這是另一種類型的問題,它可能會比未編入索引的頁面更嚴重地損害您網站的性能。Google 不喜歡空白頁面,並且很可能會降低您的排名,因為空白頁面是垃圾網站和低品質內容的信號。如果您發現您的某些頁面處於已編入索引但沒有內容狀態,請手動檢查 URL 以找出原因。例如:頁面內容可能太少、頁面可能有一些無法正確加載的渲染阻止內容、內容是隱藏的。根據所見採取措施。例如,如果頁面太空洞,請新增更多內容。在這裡,您可以在 SEO 專家利用內容編輯器的幫助下檢查您的 SERP 競爭對手並遵循他們已經歷過的最佳實踐。如果您懷疑受影響的頁面上可能存在一些阻止渲染的內容,請檢查使用第三方腳本的彈出窗口,並確保它們正常工作並且實際上可以被 Google 讀取。總而言之,Google 應該以與用戶相同的方式查看您的網頁內容。如果您的網頁內容被隱藏,請檢查所有腳本或圖像是否可供 Google 訪問。


08 重定向錯誤

SEO 專家社群裡已經討論了很多關於 URL 重定向的內容。儘管如此,SEO 操作人員仍然不斷犯錯誤,導致重定向錯誤和索引損壞。以下是 Google 無法正確讀取重定向的一些常見原因:重定向鏈太長、重定向導致無限循環、重定向 URL 超過最大 URL 長度(Google Chrome 為 2 MB)、重定向鏈包含錯誤或空 URL。修復重定向錯誤的唯一方法歸結為一句話:正確設定重定向。避免只會浪費抓取預算和消耗連結汁的長重定向鏈,確保鏈中沒有 404 或 410 URL,並始終將 URL 重定向到相關頁面。


09 伺服器錯誤(5 xx)

發生伺服器錯誤的原因可能是伺服器在 Googlebot 出現時崩潰、超時或關閉。這裡要做的第一件事是檢查受影響的 URL。轉到 GSC 中網頁索引狀態的伺服器錯誤,看看它是否仍然顯示錯誤。如果沒問題,那麼您唯一能做的就是請求重新索引。如果仍然有錯誤,您可以根據錯誤性質選擇以下選項:減少動態頁面請求的過度頁面加載、確保您網站的託管伺服器未關閉、過載或配置錯誤、檢查您是否無意中屏蔽了 Google、明智地控制網站抓取和索引、修復所有內容後,請求重新索引以使 Google 更快地獲取頁面。


10 沒有用戶選擇的規範的重複

「沒有用戶選擇的規範的重複」是 Google Search Console 中的 URL 狀態。這意味著 Google 沒有將給定頁面編入索引,因為它是另一個頁面的副本,並且沒有任何頁面使用 canonical 標籤表示為規範頁面。使用規範標籤、網站地圖和重定向向 Google 顯示它應該索引哪個頁面變體。「沒有用戶選擇的規範的重複」是多語言和/或電子商務網站的常見問題,這些網站有許多頁面具有相同或非常相似的內容,旨在用於不同目的。在這種情況下,您應該將一頁標記為規範,以防止出現重複內容問題。


11 重複, Google 選擇了與用戶不同的規範

這是一件有趣的事情。您可能已將某個頁面指定為規範,但 Google 決定選擇該頁面的另一個版本作為規範,從而將其編入索引。修復此類錯誤的最簡單方法是在 Google 選擇的頁面上放置一個規範標籤,以免將來混淆。如果您想在您選擇的頁面上保持規範,您可以將 Google 選擇的頁面重定向到您需要的 URL。


12 帶有適當規範標籤的備用頁面

注意:現在我將討論不需要任何特定操作的問題(在大多數情況下)。儘管如此,它們仍顯示在 Google Search Console 中,我想您可能想知道它們的含意。Google 不會索引頁面,因為它是規範頁面的副本。保持原樣。


13 已發現 - 目前未編入索引

如果頁面處於已發現狀態,則 Google 已經發現了它,但尚未對其進行抓取和索引。您在這裡唯一能做的就是檢查頁面的索引說明,以防有任何疑問。如果一切正常(即按照您的意圖),那麼讓 Google 稍後再做其餘的事情。


14 已爬網 - 目前未編入索引

從邏輯上講,此描述意味著 Google 已抓取您的網頁但尚未將其編入索引。如果索引說明沒有相反的說明,則該頁面將被索引。您無需要求重新編制索引,Googlebot 知道該頁面正在等待被索引。


仔細檢查 Google 未檢測到的索引問題

在發現和修復索引問題時,Google Search Console 可以為您提供很多幫助。但是如果沒有就太好了。問題是 Search Console 僅在 Google 嘗試獲取頁面並因任何原因失敗時才顯示問題。如果 Google 甚至沒有發現這樣的頁面,那麼 GSC 中就不會存在索引問題的概念。儘管這個問題可能很重要,而且實際上可能有很多。

SEO 專家有能力讓您看到頁面在 Google 中緩存的日期。您可能會問我們的 SEO 專家是如何設法看到 Google 看不到的頁面呢?答案是我們的 SEO 使用自己研發的索引和最先進的爬網引擎,可以發現其他搜索引擎出於任何原因未檢測到的頁面。現在看看緩存日期,如果日期有點太遠,像是超過一年前或根本沒有,那麼 Google 很可能不知道該頁面的存在,你必須全力找出原因。這可能是一個孤立頁面,Google 無法通過抓取您的網站找到它。如果您希望將頁面編入索引,請從相關且流量豐富的頁面連結到該頁面。此外,也可能是您錯誤地阻止了要編入索引的頁面,請記得檢查 robots.txt 檔案並深入研究標記為不允許的頁面。SEO 專家提供的可視化解決方案會是查找索引問題的另一個有用方式。在這裡,您將很容易發現孤立頁面(與其他頁面沒有連接的頁面)、損壞的頁面和長重定向鏈,這也可能是某些頁面沒有被索引的原因。

一旦您發現並解決了所有問題,請 SEO 專家生成一個新的網站地圖(如果需要,還可以生成一個 robots.txt 文件),該文件將進一步發送給 Google,以便它可以發現您需要的所有頁面。如果您需要盡快將固定網址編入索引,您可以在 Google Search Console 中手動請求重新編入索引。


結語

無論出於從託管服務廠商衍生的技術問題,到可能影響 Google 演算法處理方式的錯誤,或是 Google 更新等等原因。定期諮詢 SEO 專家審核您的頁面是如何編入索引的,因為錯誤可能隨時會發生。您最常遇到的索引問題是什麼?歡迎您與我們的 SEO 專家分享您的經驗。


  • 發布日期
  • /
  • 2022-11-25T08:00:00+08:00
  • 更新日期
  • /
  • 2024-09-02 13:20:26

注意! 本文章由饅頭老師與藍眼知識學院創作,受智慧財產權法嚴格保護。未經書面授權擅自轉載或使用者,將依法追究法律責任,絕不寬貸。