網(wǎng)站頁(yè)面相似度是指網(wǎng)頁(yè)的內(nèi)容的相似程度,當(dāng)兩個(gè)頁(yè)面相似度的在80%以上時(shí),很有可能被搜索引擎尤其是Google判斷為抄襲頁(yè)面或復(fù)制頁(yè)面,從而不被收錄,甚至降權(quán)、刪除。 搜索引擎技術(shù)可以發(fā)現(xiàn)互聯(lián)網(wǎng)上重復(fù)或者相似的內(nèi)容。搜索引擎不光會(huì)把你網(wǎng)站的內(nèi)容同其他站點(diǎn)的內(nèi)容進(jìn)行比較,還會(huì)把你網(wǎng)站的內(nèi)容和你站點(diǎn)內(nèi)的其他頁(yè)面進(jìn)行比較,以發(fā)現(xiàn)是否有重復(fù)或者類似的內(nèi)容。
建議:
我們不知道搜索引擎對(duì)相似頁(yè)面進(jìn)行懲罰的標(biāo)準(zhǔn)是多少,而且每個(gè)搜索引擎對(duì)相似度懲罰的標(biāo)準(zhǔn)也是不一樣的,所以,我們應(yīng)該盡可能的保持網(wǎng)站較低的頁(yè)面相似度。
解決辦法:
一個(gè)網(wǎng)站的操作者要控制網(wǎng)站頁(yè)面相似度低于80%,當(dāng)相似度太高時(shí),可以進(jìn)行調(diào)整,讓網(wǎng)頁(yè)不被搜索引擎認(rèn)為是復(fù)制的頁(yè)面,達(dá)到頁(yè)面容易收錄的效果。
屏蔽頁(yè)面的方法:
1、用Nofollow標(biāo)簽屏蔽,這種方法很實(shí)用,但是有點(diǎn)麻煩。
2、用Robots.txt屏蔽無(wú)用鏈接,但是這有個(gè)缺點(diǎn),就是這些頁(yè)面雖然不被搜索引擎索引,但是權(quán)重還會(huì)從其他網(wǎng)頁(yè)上傳遞進(jìn)來(lái),但是不會(huì)傳遞出去。于是就形成了一個(gè)權(quán)重黑洞,只進(jìn)不出,不過(guò)這種方法被很多站長(zhǎng)們利用
3、Meta Noindex和 Follow。搜索引擎不會(huì)收錄這些頁(yè)面,但是會(huì)爬取這些頁(yè)面上的鏈接,還是會(huì)降低蜘蛛的爬去效率。
4、利用canonical標(biāo)簽:利用cannonical標(biāo)簽可以告訴搜索引擎重復(fù)頁(yè)面中,哪個(gè)才是規(guī)范的網(wǎng)頁(yè),避免搜索結(jié)果中出現(xiàn)多個(gè)內(nèi)容相同或相似的頁(yè)面。
降低的方法
一、增加原創(chuàng)內(nèi)容
原創(chuàng)的東西是絕對(duì)獨(dú)特的,增加網(wǎng)站原創(chuàng)內(nèi)容可以有效降低網(wǎng)頁(yè)相似度,搜索引擎也喜歡這樣的網(wǎng)站。
二、放入圖片或者flash
可以將相似的頁(yè)面內(nèi)容放進(jìn)這些里面,哪怕是相似的,你也不用擔(dān)心。
三、使用Iframe
搜索引擎蜘蛛在抓取頁(yè)面內(nèi)容時(shí)會(huì)跳過(guò)Iframe,把相似的嵌套進(jìn)一個(gè)頁(yè)面就行了。
四、將一樣的部分放進(jìn)JS里面
因?yàn)镴S不會(huì)被搜索引擎認(rèn)為是很有用的代碼,所以你可以將相似的頁(yè)面放進(jìn)JS里面,對(duì)于百度來(lái)說(shuō),JS都是不可見(jiàn)的。
五、網(wǎng)站內(nèi)頁(yè)避免雷同
很多朋友喜歡把網(wǎng)站內(nèi)頁(yè)都做成一個(gè)排版布局,這樣網(wǎng)站內(nèi)頁(yè)之間的相似度就很高,我們可以適當(dāng)調(diào)整一下內(nèi)頁(yè)版塊的位置,以及不同內(nèi)頁(yè)的標(biāo)題和關(guān)鍵詞,這樣有利于搜索引擎抓取更多的頁(yè)面。
六、增加文章頁(yè)面的“上一篇”、“下一篇”、“相關(guān)文章推薦”等
在更新的文章中,每篇文章的“上一篇”、“下一篇”、“相關(guān)文章推薦”、評(píng)論等信息理論上應(yīng)當(dāng)是不同的,增加這些信息,也可以適度減少頁(yè)面的相似度,增加頁(yè)面收錄的概率 。