現在做網站最佳化的越來越多,要想做好網站SEO最佳化,網站的收錄是非常重要的,這是很多站長關心的問題,網站要想獲得好的排名,很多細節是需要我們注意的,首先就要解決網站收錄的問題,今天一起來了解一下影響網站收錄的原因。
爬蟲抓取的可識別性
在爬蟲抓取網頁時,如果根本不知道你的網頁內容是什麼,那基本上是不會被百度收錄的。所以讓爬蟲識別到我們網頁的內容也是較為關鍵的一個問題。
1、robots協議的封禁
robots是一個txt檔案,放置於網站的根目錄下。可以透過www.xxx.com/robots.txt進行訪問開啟。如果你的robots檔案封禁了百度爬蟲,那麼收錄簡直是不可能的。
因為robots協議檔案是搜尋引擎與網站之間的協議檔案。是網站告知搜尋引擎爬蟲,哪些內容你可以抓取,哪些內容你是不可以抓取。所以你都告訴爬蟲不讓它抓取了,他還怎麼會抓取呢?
2、影響網站收錄的ajax技術
js的ajax技術,其實很多做SEO的都知道不能使用js,但這並不完全是。因為爬蟲抓取的是網頁原始碼,只要你原始碼中有這些內容就是可以的。但透過js實現非同步載入的內容就不行了。
這裡解釋一下什麼是非同步載入,就是當前網頁原始碼沒有的內容。透過觸發網頁某個事件,js透過ajax技術動態載入出來的內容。例如典型的瀑布流網頁,當你滑鼠滾動到最底部,然後地步就會出現更多新的內容。多數是採用這個ajax技術。
那被非同步載入出來的內容爬蟲是看不到的。
3、圖片、導航、ALT
圖片型別的導航,現在基本很少見了。但這裡還是要說一下,如果你的導航(主導航)使用圖片,在這個寸土寸金的位置上,搜尋引擎根本不知道你說了什麼,所以這時候需要我們使用alt標籤進行設定。
alt嚴格來說是img標籤的一個屬性值,是在當圖片載入失敗時的提示文字
4、網站訪問速度慢
如果你的網站開啟速度很慢的話,也會很大程度上的影響收錄。我們舉個例子,爬蟲每天抓取你網站就給10分鐘時間,你的網站訪問一次需要1秒鐘,和需要100毫秒。這完全是兩個層次上的結果。
內容質量對收錄的影響。
內容的原創性
你的內容本身是不是原創的,原創內容更有機會被收錄這個是眾所周知的。本文不討論怎麼寫原創文章,所以原創怎麼搞,在這裡只能說自己弄明白了,然後用自己的語言組織一下寫出來。
內容的可讀性
你的網頁是不是會對使用者造成一定的體驗影響,例如廣告遮擋主體內容。主要的內容沒有在電腦首評出現。字型大小、字型顏色與背景色過於接近等。
內容的需求滿足度
標題和內容是不是提問相符的。且真正解決了使用者的需求。並不是掛羊頭賣狗肉,或者語句不通順等行為。
如何確定網站是否被降權
爬蟲抓取量突然下降
觀察至少兩週時間,看看搜尋引擎爬蟲的抓取量能不能回來,可以鎖定是網站質量被下調,導致抓取量急劇減少,注意是突然極具下降,而不是浮動。
索引量斷崖式下跌
搜尋引擎索引量突然斷崖式的下降,這也不一定是降權,因為索引庫中存著數以億億的內容儲存,有很多內容在今天可能都過時了。
搜尋引擎排名大幅下降
隨著索引量的斷崖式下降,你透過5118工具檢視自己網站的排名也大幅度下降。例如之前排名在前50名有100個詞,現在只有5個了。那肯定說明你是被降權了。
但如果只有很小的詞減少,還有一些詞上升。那也說明不了什麼,建議持續觀察一週時間,再做決策。
SEO來源流量減少較多
SEO來源流量,指的就是透過搜尋引擎點選進入我們網站的流量資料,例如uv(獨立訪客)這個指標突然大幅度下跌。上面的幾項都可以不用看可以直接斷定網站確實是被降權了。
但搜尋引擎本身也有一些審查機制,審查也就是意味著如果他們檢索出自己錯誤的判斷了你的網站,導致降權會很快進行恢復。所以一般這種情況下也建議你觀察至少3天。