使用過ECSHOP的朋友都會知道ECSHOP有嚴重的重復收錄過多的問題,很多朋友的網站實際產品加文章數量僅僅1000來個,查詢鏈接居然有3,4千,google甚至會有上萬。 重復鏈接因為Title一樣,所以常常會被搜索引擎懲罰導致收錄差,對于這個問題,SEOer們是必須要解決的,以下發表我個人的解決經驗,歡迎點評。
分析會有哪些重復鏈接產生
1.就我使用的情況,首先是產品頁和文章頁會有很多的頁面以 ?from=rss 結束
如 http://www.xxxx.com/goods-1.html?from=rss
這個的解決方法有二,一是通過刪除rss信息訂閱功能,二是Robots設置
我個人選擇的是第二種
所以我在Robots里加了一條禁止搜索引擎索引的語句:
Disallow: /*rss*
這句的意思是只要根目錄下的鏈接帶 "rss"就不索引,除非你的網站會有帶頁面地址里正好出現rss這連續三個子母,這個語句都可以解決這個問題。
2.分類頁里的動態鏈接
分類頁里充斥了大量的動態鏈接
包括屬性篩選的鏈接
排序的鏈接
顯示方式的鏈接
接下來我們逐一擊破
首先是屬性篩選的鏈接
如http://www.xxxx.com/category-1-min80-max90-attr0.html
這個是篩選里面的價格的篩選
包括其他屬性的鏈接,我們發現規律就是都會出現 "min" "max" "attr"三個詞,分別是最小,最大,屬性值
和上面的,我們在Robots加了一跳禁止抓取包括這三個詞的語句:
Disallow: /*min*
Disallow: /*max*
Disallow: /*attr*
然后,排序的鏈接和顯示方式的鏈接我們點擊后同樣會出現類似一長串,其中仍然包括 "min" "max" "attr"三個詞
因而上面Robots的設置已經可以解決
這樣就完了嗎?沒有,雖然我們設置了Robots的抓取,但為了讓蜘蛛爬行更方面直接,我們需要做另外一個工作,就是限制爬行
找到模板文件里對應的屬性篩選和產品列表的模板文件(我自己的是cat_filter.lbi和goods_list.lbi)
找到屬性篩選、排序、顯示方式的鏈接代碼,在其里增加一句 rel="nofollow",意思就是限制爬行
robots的作用在于禁止抓取,而nofollow則在于禁止爬行,雙管齊下很好的引導了蜘蛛和搜索引擎
3.其它的一些重復動態鏈接
我個人發現的其它重復鏈接還包括品牌商品里的顯示方式
如http://www.xxxx.com/brand-1-c0.html?display=text等
我在Robots同樣加了三句
Disallow: /*min*
Disallow: /*max*
Disallow: /*attr*
就解決了不同顯示方式還有不同鏈接的重復收錄問題
以上個人所提到的并未包含所有的動態鏈接,但給大家做了一個不錯的參考,因為萬變不離其宗,朋友們可以依據我提到的方法和思路慢慢的把自己的Robots寫完整,同時適當的使用nofollow在模板里限制蜘蛛的爬行
注意的是對于已經收錄了大量的重復鏈接,您進行以上提到的修改,搜索引擎并不能快速做出反應,對待新的頁面會限制收錄重復頁面,但對于已經收錄的重復鏈接,搜索引擎需要花了一段時間取消收錄而重新收錄主頁面,個人的經驗是至少需要2個月。
以上經驗由泰摩網球www.taimo.cn原創整理,歡迎轉載,但請保留網址,謝謝支持。