五月综合缴情婷婷六月,色94色欧美sute亚洲线路二,日韩制服国产精品一区,色噜噜一区二区三区,香港三级午夜理伦三级三

您現(xiàn)在的位置: 365建站網(wǎng) > 365文章 > SEO之站內(nèi)優(yōu)化:網(wǎng)站結(jié)構(gòu)優(yōu)化

SEO之站內(nèi)優(yōu)化:網(wǎng)站結(jié)構(gòu)優(yōu)化

文章來(lái)源:365jz.com     點(diǎn)擊數(shù):493    更新時(shí)間:2018-02-03 23:09   參與評(píng)論

SEO之站內(nèi)優(yōu)化:網(wǎng)站結(jié)構(gòu)優(yōu)化

良好的網(wǎng)站結(jié)構(gòu)不僅可以引導(dǎo)Spider快速高效地抓取全站內(nèi)容,還可以輔助站內(nèi)權(quán)重的合理導(dǎo)向,最重要的是,良好的網(wǎng)站結(jié)構(gòu)是用戶體驗(yàn)的基礎(chǔ)。雖然這部分內(nèi)容在網(wǎng)絡(luò)和其他SEO書(shū)籍中已經(jīng)被討論得比較多了,但確實(shí)還是有很多需要注意的地方值得討論一下。這里不再贅述Flash網(wǎng)站不利于優(yōu)化之類(lèi)的話題,僅挑選一些業(yè)內(nèi)經(jīng)常討論的、疑惑比較多的點(diǎn)進(jìn)行討論。

5.1.1 URL優(yōu)化注意事項(xiàng)

并不是所有的SEO人員都能在工作中接觸到URL優(yōu)化。不少公司網(wǎng)站不需要新的URL規(guī)則,也不需要改版重新設(shè)計(jì)URL,就算設(shè)計(jì)URL結(jié)構(gòu),一般也都是SEO負(fù)責(zé)人來(lái)設(shè)計(jì)的,基層SEO人員并不會(huì)實(shí)際操作URL的設(shè)計(jì)和優(yōu)化。但是為了美好的明天,或者如果自己擁有個(gè)人站試驗(yàn),也要對(duì)這部分內(nèi)容進(jìn)行詳細(xì)的了解。首先SEO人員都知道的URL設(shè)計(jì)原則是越短越好,參數(shù)越少越好,下面針對(duì)URL設(shè)計(jì)中的幾個(gè)小問(wèn)題進(jìn)行討論。

1.URL目錄層級(jí)不要過(guò)多

有SEO基礎(chǔ)的朋友應(yīng)該都了解網(wǎng)站的物理結(jié)構(gòu)和邏輯結(jié)構(gòu)。一般認(rèn)為物理結(jié)構(gòu)上,網(wǎng)站URL涉及的目錄層級(jí)越少越好,即網(wǎng)頁(yè)在物理結(jié)構(gòu)上越靠近首頁(yè)越好(在瀏覽器中訪問(wèn)網(wǎng)頁(yè)時(shí),動(dòng)態(tài)生成的URL上體現(xiàn)出來(lái)的結(jié)構(gòu)和文件在服務(wù)器上存放的真實(shí)位置是沒(méi)有什么區(qū)別的)。可以這樣比喻,目錄層級(jí)類(lèi)似于家族輩分,層級(jí)越多輩分越低,

不考慮其外鏈的情況下,從族長(zhǎng)處分得的地位就越低,也就是頁(yè)面權(quán)重越低。很多大型網(wǎng)站由于歷史或者其他原因都有很復(fù)雜的物理層級(jí)結(jié)構(gòu),理論上這不僅會(huì)降低頁(yè)面本身通過(guò)層級(jí)傳遞獲得的“天生的權(quán)重”,也不利于網(wǎng)頁(yè)鏈接在站內(nèi)站外的引用。

比如以下幾個(gè)老牌網(wǎng)站的URL結(jié)構(gòu),充滿了“層次感”。

央視網(wǎng):http://military.cntv.cn/program/jsbd/20121101/107910.shtml

河北新聞網(wǎng):http://hebei.hebnews.cn/2012-11/04/content_2921856.htm

合肥在線:http://news.hf365.com/system/2012/10/18/012681457.shtml

當(dāng)然這是強(qiáng)勢(shì)媒體網(wǎng)站,使用的一般都是比較久遠(yuǎn)的CMS文章系統(tǒng)。當(dāng)初設(shè)計(jì)時(shí)就沒(méi)有考慮到URL結(jié)構(gòu)問(wèn)題,只是管理人員按自己意愿進(jìn)行設(shè)置的。比如這三個(gè)URL中的日期,有的占了一層,有的占了兩層,有的占了三層,除了按日期歸檔的目錄層級(jí)以外,還有不必要的系統(tǒng)目錄。其實(shí)完全可以把文章都放到一個(gè)固定分類(lèi)的一級(jí)目錄中,如有必要進(jìn)行日期歸檔的話,單獨(dú)設(shè)計(jì)日期歸檔頁(yè)面就可以了,沒(méi)有必要把文章都放到多層日期歸檔目錄的下面。這些媒體網(wǎng)站有著自己的流量渠道,也可能不太注重或者還沒(méi)有開(kāi)始注重SEO。

如果營(yíng)銷(xiāo)型網(wǎng)站也這樣來(lái)設(shè)計(jì)URL結(jié)構(gòu),那么可能在最基礎(chǔ)的部分就比競(jìng)爭(zhēng)對(duì)手差了一些。同樣的網(wǎng)站權(quán)重、同樣的內(nèi)部鏈接設(shè)計(jì)、同樣的外鏈質(zhì)量和數(shù)量,但是你的目錄層級(jí)多,家族輩分低,出門(mén)競(jìng)爭(zhēng)的強(qiáng)度也會(huì)相對(duì)弱一些。比如,下面是搜房網(wǎng)和中關(guān)村在線的URL結(jié)構(gòu)設(shè)計(jì)示例。

搜房網(wǎng)租房房源中的交叉組合查詢頁(yè)面的鏈接,全部參數(shù)有10多個(gè),搜房網(wǎng)通過(guò)偽靜態(tài)把URL結(jié)構(gòu)控制在了兩層以內(nèi):

http://zu.gz.soufun.com/house-a073-b01215/a21-c20-d2500-g22-n20-o25-p21-r22-s25-t22-u22-n31/

中關(guān)村在線平板電腦產(chǎn)品庫(kù)的交叉查詢頁(yè)面的鏈接,全部參數(shù)也超過(guò)10個(gè)了,和搜房網(wǎng)一樣,也是通過(guò)偽靜態(tài)把URL的目錄層級(jí)控制在了兩層以內(nèi):

http://detail.zol.com.cn/tablepc_index/subcate702_98_list_s3596-s1978-s2780-s2397-s2526-s3092-c79_1.html

所以如果需要設(shè)計(jì)URL結(jié)構(gòu),目錄層級(jí)應(yīng)該控制一下。盡量使網(wǎng)站趨于扁平化,不要增加不必要的目錄層級(jí)。現(xiàn)在常見(jiàn)的URL結(jié)構(gòu)設(shè)計(jì)為:目錄頁(yè)和專題頁(yè)URL的設(shè)計(jì)層級(jí)都盡可能少,甚至很多人會(huì)設(shè)計(jì)成全部使用一級(jí)目錄;內(nèi)容頁(yè)一般放在一級(jí)目錄下,甚至直接放在域名下,而不是放在分類(lèi)目錄下,目錄頁(yè)面往往只是對(duì)內(nèi)容的歸類(lèi)列表頁(yè)而已。例如一呼百應(yīng)網(wǎng)www域名下的信息頁(yè)URL及該信息所隸屬的分類(lèi)目錄URL:

http://www.youboy.com/s4618198.html
http://www.youboy.com/cp/wujingongju/

2.動(dòng)態(tài)URL并不一定需要偽靜態(tài)

在SEO診斷工作中,很多朋友喜歡先檢查對(duì)方網(wǎng)站是不是動(dòng)態(tài)URL,如果是動(dòng)態(tài)URL,就會(huì)毫不思索地建議對(duì)方做偽靜態(tài)。這其實(shí)是不合理的,有的網(wǎng)站所有URL中只會(huì)有一個(gè)動(dòng)態(tài)參數(shù),只是不同類(lèi)型頁(yè)面URL的動(dòng)態(tài)參數(shù)不同而已。做不做偽靜態(tài)都是可以的,搜索引擎都會(huì)正常抓取,也并不會(huì)因?yàn)樽隽藗戊o態(tài)而提升多少用戶體驗(yàn)。很多博客系統(tǒng)就是這樣,比如WordPress的URL結(jié)構(gòu)。

文章頁(yè):http://www.pizirui.com/?p=591

目錄頁(yè):http://www.pizirui.com/?cat=3

單頁(yè)面:http://www.pizirui.com/?page_id=38

文章歸檔頁(yè)面:http://www.pizirui.com/?m=201208

這樣頁(yè)面URL已經(jīng)很簡(jiǎn)單了,就不需要進(jìn)行偽靜態(tài)了。除非有的朋友喜歡在URL中加幾個(gè)關(guān)鍵詞,需要進(jìn)行偽靜態(tài)的設(shè)置,否則完全沒(méi)有必要做偽靜態(tài)的工作。使用開(kāi)源CMS系統(tǒng)做偽靜態(tài)一般都會(huì)有官方規(guī)則,如果是找建站公司做網(wǎng)站,那么就需要自己或重新找建站公司來(lái)寫(xiě)偽靜態(tài)規(guī)則,雖然參數(shù)少的情況下對(duì)技術(shù)要求并不高,但也是需要技術(shù)支持的。沒(méi)必要的工作何必浪費(fèi)精力呢?對(duì)于站內(nèi)參數(shù)復(fù)雜的網(wǎng)站,做偽靜態(tài)還是有必要的。比如商城類(lèi)、房產(chǎn)類(lèi)網(wǎng)站都有很多交叉查詢的參數(shù),房產(chǎn)類(lèi)網(wǎng)站的參數(shù)經(jīng)常會(huì)有10個(gè)以上。其實(shí)如果站內(nèi)參數(shù)設(shè)置沒(méi)有問(wèn)題也不必進(jìn)行偽靜態(tài),不過(guò)大部分網(wǎng)站為了使得URL簡(jiǎn)潔、目錄層級(jí)少,也會(huì)精心設(shè)計(jì)偽靜態(tài)規(guī)則。有必要提醒的是超過(guò)10個(gè)參數(shù)的偽靜態(tài)就不能通過(guò)簡(jiǎn)單映射完成了,還需要其他技術(shù)輔助。如上面提到的搜房網(wǎng)和中關(guān)村在線的鏈接結(jié)構(gòu)。

以前之所以強(qiáng)調(diào)把動(dòng)態(tài)URL轉(zhuǎn)化成靜態(tài)URL,是因?yàn)樵人阉饕姹容^排斥動(dòng)態(tài)URL的多參數(shù)。有很多網(wǎng)站設(shè)置了很多動(dòng)態(tài)參數(shù)使得Spider永遠(yuǎn)抓不完這些頁(yè)面,并且這些頁(yè)面的內(nèi)容可能是完全重復(fù)的,或者程序出現(xiàn)Bug產(chǎn)生無(wú)數(shù)動(dòng)態(tài)鏈接使得Spider陷入死循環(huán)?,F(xiàn)在,隨著站長(zhǎng)們SEO意識(shí)的提高,以及搜索引擎自身技術(shù)的提高,很少會(huì)出現(xiàn)把Spider引入無(wú)底洞的情況了。站長(zhǎng)會(huì)經(jīng)常檢查網(wǎng)站是否有鏈接錯(cuò)誤或無(wú)效URL產(chǎn)生,Spider也會(huì)對(duì)各種URL有選擇性地抓取,所以以前因?yàn)閯?dòng)態(tài)URL而產(chǎn)生的Spider抓取問(wèn)題,現(xiàn)在已經(jīng)很少了。

另外,現(xiàn)在百度還會(huì)自動(dòng)去除URL中的無(wú)效參數(shù)。如圖5-1所示,千品網(wǎng)的大部分URL的末尾都加上了追蹤用戶行為的參數(shù),并且原來(lái)千品網(wǎng)并沒(méi)有設(shè)置robots文件,但是百度并沒(méi)有收錄這些帶參數(shù)的URL,而收錄了去除參數(shù)后的URL。當(dāng)時(shí)由于千品網(wǎng)站內(nèi)只有帶參數(shù)的URL,反而真實(shí)的URL并沒(méi)有直接鏈接。千品網(wǎng)的SEO負(fù)責(zé)人還和筆者進(jìn)行了多次討論,首先這些參數(shù)是運(yùn)營(yíng)人員要求加的,再者也疑惑為什么百度沒(méi)有收錄這些帶參數(shù)的URL,反而收錄了不帶參數(shù)的URL,因?yàn)檎鎸?shí)的URL當(dāng)時(shí)在網(wǎng)絡(luò)是不存在的。就此,筆者專門(mén)咨詢了百度站長(zhǎng)平臺(tái)的運(yùn)營(yíng)人員,對(duì)方說(shuō)明“百度會(huì)自動(dòng)嘗試去掉URL中的一些無(wú)效參數(shù)”。后來(lái)千品網(wǎng)使用Sitemap把真實(shí)URL提交到了百度,并且以防萬(wàn)一,配置了robots文件來(lái)禁止Spider抓取站內(nèi)動(dòng)態(tài)URL。

圖5-1 千品網(wǎng)北京站首頁(yè)部分源代碼

由此可見(jiàn)現(xiàn)在搜索引擎對(duì)動(dòng)態(tài)URL的處理還是比較智能的,所以如果網(wǎng)站內(nèi)的動(dòng)態(tài)參數(shù)不多,網(wǎng)站結(jié)構(gòu)不復(fù)雜,完全沒(méi)有必要糾結(jié)于做偽靜態(tài)。當(dāng)然必要的URL優(yōu)化工作還是要做的,不可能完全寄希望于搜索引擎,如果搜索引擎什么問(wèn)題都能解決,那么SEO就沒(méi)有存在的意義了。對(duì)于千品網(wǎng)的這類(lèi)URL問(wèn)題,也有不少網(wǎng)站百度沒(méi)有處理好。如圖5-2所示,不知道黃頁(yè)88網(wǎng)首頁(yè)為什么會(huì)有“?

tob0odt6ll=WGmDSiNhRV”這樣的參數(shù),并且這個(gè)參數(shù)并不會(huì)改變網(wǎng)頁(yè)內(nèi)容,然而百度還是收錄了,可見(jiàn)完全依靠百度自己判斷URL中的參數(shù)是否有意義是不靠譜的。

圖5-2 百度收錄含有無(wú)效參數(shù)的URL

很多拿萬(wàn)年歷系統(tǒng)來(lái)舉例的SEO人員,表示萬(wàn)年歷系統(tǒng)會(huì)引導(dǎo)Spider無(wú)限地抓取下去,不僅造成站內(nèi)資源浪費(fèi),也會(huì)浪費(fèi)Spider的抓取。先不談現(xiàn)在的搜索引擎會(huì)不會(huì)玩命地抓取這些URL,但作為站長(zhǎng)和SEO人員,除非你用萬(wàn)年歷系統(tǒng)來(lái)歸類(lèi)內(nèi)容,否則在該功能上線之初就應(yīng)該屏蔽搜索引擎對(duì)這些URL的抓取。

綜上,如果是出于方便Spider抓取的目的,并不是所有動(dòng)態(tài)URL的網(wǎng)站都需要靜態(tài)化。如果你的網(wǎng)站系統(tǒng)龐大或者擁有和搜房、中關(guān)村在線類(lèi)似的多參數(shù)URL,那么就最好靜態(tài)化處理一下;如果你的網(wǎng)站系統(tǒng)很簡(jiǎn)單,只有一兩個(gè)參數(shù),就沒(méi)有必要糾結(jié)偽靜態(tài)問(wèn)題。對(duì)于動(dòng)態(tài)參數(shù)產(chǎn)生的頁(yè)面重復(fù)問(wèn)題,不是通過(guò)偽靜態(tài)來(lái)解決的,而是需要通過(guò)技術(shù)去除或robots.txt文件及其他標(biāo)簽設(shè)置來(lái)解決的;對(duì)于由程序BUG生成無(wú)限參數(shù)造成蜘蛛陷阱的網(wǎng)站,使用偽靜態(tài)也未必能解決問(wèn)題,還是需要站長(zhǎng)和SEO人員時(shí)常分析網(wǎng)站日志,修補(bǔ)Bug。當(dāng)然偽靜態(tài)還可以把動(dòng)態(tài)參數(shù)映射成關(guān)鍵詞拼音或英文單詞,甚至可以是中文關(guān)鍵詞,有些網(wǎng)站出于這方面考慮,也可以推進(jìn)網(wǎng)站URL的靜態(tài)化。

SEO人員在進(jìn)行網(wǎng)站優(yōu)化方案寫(xiě)作時(shí),最好根據(jù)網(wǎng)站實(shí)際情況進(jìn)行偽靜態(tài)建議。不要一旦發(fā)現(xiàn)對(duì)方是動(dòng)態(tài)URL就提出做偽靜態(tài)的建議,除非你認(rèn)為這樣做SEO方案顯得你更加專業(yè)。

3.URL中最好可以包含關(guān)鍵詞

如圖5-3所示為百度搜索“ipad3”的結(jié)果,百度把URL中的“ipad3”也進(jìn)行了匹配加粗。所以在URL中布局關(guān)鍵詞也可以增加網(wǎng)頁(yè)和搜索詞的相關(guān)度,很多大型網(wǎng)站甚至在URL中使用了大量中文。

現(xiàn)在雙拼和三拼域名炒得這么火,域名本身所帶來(lái)的自然流量也是提升域名價(jià)值的一個(gè)重要因素。這種域名對(duì)在搜索引擎上優(yōu)化對(duì)應(yīng)關(guān)鍵詞也有一定的促進(jìn)作用。


圖5-3 百度搜索“ipad3”

4.中文URL問(wèn)題

經(jīng)百度官方人員確認(rèn),只要URL不是過(guò)長(zhǎng),百度對(duì)中文URL的收錄就沒(méi)有問(wèn)題。如圖5-4所示為在百度中使用inurl指令搜索URL中含有“聯(lián)想筆記本”的網(wǎng)頁(yè)??梢?jiàn)有不少網(wǎng)站在URL中使用了中文,并沒(méi)有影響百度的收錄。在URL中使用中文關(guān)鍵詞可以加強(qiáng)網(wǎng)頁(yè)和關(guān)鍵詞的匹配程度,不過(guò)現(xiàn)在有一些網(wǎng)站認(rèn)為百度對(duì)中文URL收錄可能不夠友好,而采用了拼音、英文單詞或者拼音首字母形式的URL。

 

程度上降低了用戶體驗(yàn),也不便于分享和外鏈建設(shè)。并且如果是非知名的網(wǎng)站,中文URL過(guò)多,很容易被用戶認(rèn)為是垃圾站點(diǎn),所以不宜對(duì)站內(nèi)重要頁(yè)面使用中文URL。對(duì)于TAG聚合頁(yè)面倒是不必?fù)?dān)心中文

URL問(wèn)題,現(xiàn)在很多網(wǎng)站都使用TAG詞庫(kù)來(lái)作弊搶奪流量??梢?jiàn)搜索引擎對(duì)中文URL收錄還是很友好的,不過(guò)因?yàn)榫W(wǎng)站沒(méi)有內(nèi)容而湊關(guān)鍵詞,很多使用TAG詞的網(wǎng)站都被百度懲罰了。

因此中文URL是可以使用的,但是要綜合考慮,它可以增加頁(yè)面和關(guān)鍵詞的相關(guān)度,也會(huì)降低用戶體驗(yàn)度,同時(shí),如果自身內(nèi)容不到位,還有可能被百度處理TAG詞作弊時(shí)所誤傷。

5.相對(duì)路徑和絕對(duì)路徑

在網(wǎng)站設(shè)計(jì)時(shí),有不少朋友會(huì)考慮相對(duì)路徑和絕對(duì)路徑對(duì)SEO的影響。其實(shí)不論使用相對(duì)路徑還是使用絕對(duì)路徑,搜索引擎都可以正常抓取。兩種路徑各自的優(yōu)缺點(diǎn)如下。

絕對(duì)路徑優(yōu)缺點(diǎn):

(1)如果你的文章內(nèi)容被轉(zhuǎn)載或采集且對(duì)方比較懶,沒(méi)有除去你加的鏈接,就會(huì)給你的網(wǎng)站增加一些外鏈。

(2)如果你的網(wǎng)站沒(méi)有做301,并且你把帶www和不帶www的域名都解析到一個(gè)站點(diǎn),可能會(huì)產(chǎn)生網(wǎng)址規(guī)范化問(wèn)題。使用絕對(duì)路徑,可以告訴搜索引擎你使用是哪個(gè)版本的URL,防止搜索引擎自動(dòng)選擇你不想讓它收錄的URL版本。比如你把domain.com和www.domain.com解析到了一個(gè)站點(diǎn),你想讓搜索引擎收錄www.domain.com下的內(nèi)容。但是你沒(méi)有做或者不能做301,并且你使用的是相對(duì)路徑的URL,那么搜索引擎從domain.com進(jìn)入網(wǎng)站網(wǎng)頁(yè)體積都不會(huì)太大,都可以被搜索引擎完整抓取。所以相對(duì)來(lái)說(shuō)絕對(duì)路徑更好一些。
 

6.字母小寫(xiě)且不要用特殊符號(hào)

URL中的字母全部小寫(xiě),便于人工輸入,不會(huì)因?yàn)榇笮?xiě)摻雜產(chǎn)生錯(cuò)誤。并且Linux系統(tǒng)服務(wù)器是區(qū)分大小寫(xiě)字母的。在一些流量統(tǒng)計(jì)工具中也會(huì)把有大小寫(xiě)問(wèn)題的同一個(gè)URL當(dāng)成兩個(gè)URL來(lái)統(tǒng)計(jì),這增加了流量分析的難度。如無(wú)必要,不要在URL中使用特殊符號(hào),否則可能會(huì)出現(xiàn)不可預(yù)知的錯(cuò)誤。并且在站外引用鏈接時(shí),如果URL中包特殊符號(hào),很可能導(dǎo)致被引用的鏈接解析不完整。

7.目錄最后的斜杠問(wèn)題

有很多朋友發(fā)現(xiàn)百度同時(shí)收錄了網(wǎng)站URL最后帶“/”與不帶“/”的兩種形式。如圖5-5和圖5-6所示,兩個(gè)URL的快照并不同,可見(jiàn)百度把兩個(gè)URL當(dāng)成了不同的頁(yè)面,曾經(jīng)一度出現(xiàn)過(guò)兩種URL共同存在某個(gè)關(guān)鍵詞的搜索結(jié)果首頁(yè)。

圖5-5 帶斜杠的URL被收錄


圖5-6 不帶斜杠的URL也被收錄

且不論百度會(huì)不會(huì)把這兩種URL當(dāng)成重復(fù)頁(yè)面對(duì)待,站長(zhǎng)和SEO人員自己首先就應(yīng)該先把URL進(jìn)行統(tǒng)一。如果是目錄那么就用正常的目錄形式,如果是文件那么就用文件形式。當(dāng)用戶或Spider訪問(wèn)

www.domain.com/abc時(shí),部分服務(wù)器發(fā)現(xiàn)網(wǎng)站根目錄下沒(méi)有abc這個(gè)文件,那么就會(huì)報(bào)404錯(cuò)誤,也可能會(huì)自動(dòng)301或302跳轉(zhuǎn)到www.domain.com/abc/上,也有部分服務(wù)器是兩個(gè)URL都可以正常訪問(wèn)的。不論服務(wù)器使用哪種處理方式,站長(zhǎng)和SEO人員最好都要保持站內(nèi)URL的統(tǒng)一,不至于內(nèi)鏈和外鏈都被分散到兩種URL上去。因?yàn)榘俣戎覆欢〞?huì)在排名中使用哪個(gè)版本的URL。另外,目錄URL和目錄首頁(yè)文件的URL也有同樣的問(wèn)題,同樣需要網(wǎng)址規(guī)范化,做好301及站內(nèi)只使用一個(gè)版本的URL,例如www.domain.com/abc/和www.domain.com/ abc/index.html。

《百度搜索引擎優(yōu)化指南》中對(duì)于網(wǎng)站URL的建議如下。

(1)網(wǎng)站中同一網(wǎng)頁(yè)只對(duì)應(yīng)一個(gè)URL,如果網(wǎng)站上多種URL都能訪問(wèn)同樣的內(nèi)容,會(huì)有如下危險(xiǎn):

·搜索引擎會(huì)選一種URL為標(biāo)準(zhǔn),可能會(huì)和正版不同;

·用戶可能為同一網(wǎng)頁(yè)的不同URL做推薦,多種URL形式分散了該網(wǎng)頁(yè)的權(quán)重。

如果你的網(wǎng)站上已經(jīng)存在多種URL形式,建議按以下方式處理:

·在系統(tǒng)中只使用正常形式URL,不讓用戶接觸到非正常形式的URL;

·不把Session ID、統(tǒng)計(jì)代碼等不必要的內(nèi)容放在URL中;

·不同形式的URL,301永久跳轉(zhuǎn)到正常形式;

·防止用戶輸錯(cuò)而啟用的備用域名,301永久跳轉(zhuǎn)到主域名;

·使用robots.txt禁止BaiduSpider抓取你不想向用戶展現(xiàn)的形式。

(2)讓用戶能從URL判斷出網(wǎng)頁(yè)內(nèi)容以及網(wǎng)站結(jié)構(gòu)信息,并可以預(yù)測(cè)將要看到的內(nèi)容。


以百度空間為例,URL結(jié)構(gòu)中加入了用戶ID信息,用戶在看到空間的URL時(shí),可以方便的判斷是誰(shuí)的空間。URL結(jié)構(gòu)中還加入了Blog、Album等內(nèi)容信息,用戶可以通過(guò)URL判斷將要看到的內(nèi)容是一篇博客,還是一個(gè)相冊(cè)。

(3)URL盡量短。

長(zhǎng)長(zhǎng)的URL不僅不美觀,用戶還很難從中獲取額外有用的信息。另一方面,短URL還有助于減小頁(yè)面體積,加快網(wǎng)頁(yè)打開(kāi)速度,提升用戶體驗(yàn)。

首先要明白制作網(wǎng)站地圖的目的是什么?比如針對(duì)Spider抓取的XML地圖,XML網(wǎng)站地圖的制作可以方便Spider對(duì)全站重要頁(yè)面的抓取。這是SEO人員熟悉得不能再熟悉的理論了。如果你的網(wǎng)站結(jié)構(gòu)比較復(fù)雜,或者你有資源處于多級(jí)目錄下,Spider自己不容易抓取全站的內(nèi)容,此時(shí)你是需要XML地圖引導(dǎo)一下Spider的;如果你只是一個(gè)小型博客站點(diǎn),或者只有幾十個(gè)網(wǎng)頁(yè)的公司網(wǎng)站,網(wǎng)站結(jié)構(gòu)沒(méi)問(wèn)題,鏈接都可以正常抓取的話,Spider很容易就把你網(wǎng)站所有內(nèi)容都抓一遍了,此時(shí)就沒(méi)有必要制作XML地圖了。所以并不是所有的網(wǎng)站都必須使用XML地圖,做SEO的朋友也不需要把制作XML地圖當(dāng)做SEO優(yōu)化方案的必加建議。

對(duì)于HTML地圖,一般認(rèn)為是方便用戶瀏覽網(wǎng)站才進(jìn)行制作的,和XML地圖一樣,結(jié)構(gòu)復(fù)雜的網(wǎng)站需要,結(jié)構(gòu)簡(jiǎn)單的網(wǎng)站并不需要。

如果一個(gè)網(wǎng)站所有頻道和重要內(nèi)容都在首頁(yè)上有鏈接了,那么再單獨(dú)做一個(gè)HTML的地圖干什么呢?如果網(wǎng)站結(jié)構(gòu)復(fù)雜,頻道眾多,網(wǎng)站首頁(yè)上不可能放這么多重要頁(yè)面的鏈接,此時(shí)就需要一個(gè)HTML的地圖來(lái)方便引導(dǎo)用戶瀏覽網(wǎng)站。

如圖5-7所示為搜房網(wǎng)的HTML地圖,搜房網(wǎng)有太多重要的目錄和頁(yè)面了,在網(wǎng)站首頁(yè)不可能有這么多空間來(lái)放這么多鏈接,即使全放到首頁(yè),用戶體驗(yàn)也會(huì)非常糟糕,所以這個(gè)HTML地圖對(duì)用戶有很好的引導(dǎo)作用,方便用戶快速找到自己所需要瀏覽的頻道、目錄、專題或詳細(xì)信息頁(yè)面。


圖5-7 搜房網(wǎng)HTML地圖

2.不推薦使用站外XML地圖生成工具

如果確定網(wǎng)站的確需要制作XML地圖引導(dǎo)一下Spider,就要考慮怎樣制作這個(gè)XML地圖了。對(duì)于XML地圖的格式,網(wǎng)絡(luò)上有很多介紹,百度站長(zhǎng)平臺(tái)的“推薦閱讀”區(qū)Sitemap工具的介紹中也有詳細(xì)講解,在此就不多做介紹了。這里重點(diǎn)談一下怎么來(lái)做這個(gè)XML地圖。

很多朋友在網(wǎng)上尋找制作XML地圖的工具,網(wǎng)上也確實(shí)有很多相關(guān)工具。這些工具一般需要你提交一個(gè)頁(yè)面作為入口,然后模擬

Spider抓取你的網(wǎng)站。筆者不認(rèn)為這些工具的Spider比搜索引擎的

Spider還要強(qiáng)大,這些工具的Spider能夠抓取到的頁(yè)面搜索引擎基本上都可以抓取到。并且對(duì)于網(wǎng)站內(nèi)隱藏比較深的頁(yè)面,這些工具也不

一定能夠抓全,所以不推薦使用站外XML地圖生成工具。

作為站長(zhǎng)或SEO人員,應(yīng)該對(duì)自己的網(wǎng)站了如指掌。如果想制作

XML地圖,最好根據(jù)網(wǎng)站內(nèi)容和數(shù)據(jù)庫(kù)字段批量生成有效網(wǎng)頁(yè)的URL。

現(xiàn)在的網(wǎng)站差不多都是動(dòng)態(tài)程序了,網(wǎng)站URL一般都是數(shù)據(jù)庫(kù)驅(qū)動(dòng)的。

所以大家根據(jù)數(shù)據(jù)庫(kù)的字段和網(wǎng)站URL結(jié)構(gòu)進(jìn)行對(duì)比組合批量生成就可以了,去除那些不希望被搜索引擎抓取的參數(shù),只提取有效參數(shù),才能制作出高質(zhì)量的XML地圖。這樣的XML地圖才可以方便Spider抓取正常情況下抓取不到的內(nèi)容,方便搜索引擎抓取全站的內(nèi)容。使用外部工具抓自己的網(wǎng)站不但消耗自己的服務(wù)器和帶寬資源,抓取到的URL可能還會(huì)包含很多垃圾頁(yè)面,更會(huì)降低這種XML地圖的價(jià)值。

不過(guò),如果確實(shí)沒(méi)有能力根據(jù)數(shù)據(jù)庫(kù)批量生成有效頁(yè)面的URL,通過(guò)日志分析又發(fā)現(xiàn)有太多站內(nèi)頁(yè)面遲遲沒(méi)有被搜索引擎抓取,本著“有總比沒(méi)有強(qiáng)”的目的也可以使用站外工具制作一個(gè)XML地圖提交到搜索引擎,在制作過(guò)程中及提交地圖之前一定要檢查一下地圖中URL是否有錯(cuò)誤,是否存在垃圾鏈接過(guò)多等問(wèn)題。不提交Sitemap就只能等待搜索引擎發(fā)現(xiàn)網(wǎng)站的URL后才抓取,提交Sitemap后就是把網(wǎng)站的URL提交給搜索引擎直接抓取,提交Sitemap就相當(dāng)于幫助搜索引擎省去了發(fā)現(xiàn)URL的步驟,相對(duì)來(lái)說(shuō)會(huì)提升網(wǎng)站內(nèi)網(wǎng)頁(yè)被搜索引擎抓取效率。至于生成工具,Site Map Maker、SiteMap Builder等都是相對(duì)比較不錯(cuò)的,有需要的朋友可以了解一下。

所以,如果網(wǎng)站結(jié)構(gòu)比較簡(jiǎn)單,網(wǎng)頁(yè)也比較少,就沒(méi)有必要糾結(jié)是否需要制作和提交網(wǎng)站地圖;如果網(wǎng)站內(nèi)頁(yè)面比較多且有一定的技術(shù)能力,就可以按照數(shù)據(jù)庫(kù)中的字段來(lái)批量為有內(nèi)容的頁(yè)面生成網(wǎng)站地圖;如果網(wǎng)站內(nèi)頁(yè)面比較多,但又沒(méi)有能力通過(guò)技術(shù)手段生成高質(zhì)量的網(wǎng)站地圖,那么也可以通過(guò)站外生成工具來(lái)制作,不過(guò)一定要嚴(yán)格檢查生成URL的正確性和質(zhì)量,如果提交太多垃圾頁(yè)面的URL,就等于直接告訴搜索引擎你的站點(diǎn)內(nèi)容質(zhì)量不怎么樣了。

3.網(wǎng)站地圖入口和格式問(wèn)題

對(duì)于XML版的地圖,Google Webmaster和百度站長(zhǎng)平臺(tái)都已經(jīng)有專門(mén)的提交入口。對(duì)于HTML版的地圖,最好在全站的頁(yè)腳都推薦一下,因?yàn)檫@是主要為用戶服務(wù)的,要讓用戶隨時(shí)都可以找到網(wǎng)站地圖,從而更方便地瀏覽網(wǎng)站。對(duì)于Google,還可以在robots.txt文件中聲明站點(diǎn)地圖的位置,且Google可以支持單個(gè)地圖文件含URL的上限為50000條,文件大小為50MB。而百度暫時(shí)只支持通過(guò)站長(zhǎng)平臺(tái)提交網(wǎng)站地圖,不支持robots.txt文件聲明,所支持的地圖文件URL條數(shù)上限也為50000條,不過(guò)文件大小上限為10MB。另外Google和百度都支持XML形式之外的純文本地圖,但是Google只支持UTF-8編碼,百度則支持UTF-8和GBK兩種編碼。

所以,如果使用同一套地圖文件同時(shí)提供給Google和百度,需要讓地圖文件同時(shí)符合兩邊的要求:?jiǎn)蝹€(gè)文件的大小不要超過(guò)10MB,所含URL不要超過(guò)50000條;當(dāng)使用純文本文件時(shí),要使用UTF-8編碼;兩邊都支持經(jīng)過(guò)gzip壓縮的地圖文件;兩邊都支持地圖索引文件提交。

5.1.3 robots.txt相關(guān)問(wèn)題及用途

robots.txt文件是引導(dǎo)搜索引擎Spider抓取網(wǎng)站的文件。合理地使用robots.txt文件可以防止自己網(wǎng)站內(nèi)諸如后臺(tái)登入之類(lèi)的秘密頁(yè)面被搜索引擎抓取索引和公布,還可以屏蔽搜索引擎對(duì)網(wǎng)站非內(nèi)容頁(yè)面的抓取,只讓搜索引擎抓取和收錄能夠帶來(lái)排名和流量的頁(yè)面。在

robots.txt文件的使用中有下面幾個(gè)問(wèn)題值得討論一下。

1.要不要使用robots.txt

對(duì)于有需要屏蔽Spider抓取的內(nèi)容的網(wǎng)站,當(dāng)然是需要robots.txt

文件的。但是對(duì)于希望把內(nèi)容全部開(kāi)放給Spider的網(wǎng)站來(lái)說(shuō)robots.txt

就沒(méi)有意義了,那么此時(shí)還需不需要這個(gè)robots.txt文件呢?

2012年11月1日,百度、360和搜狗等國(guó)內(nèi)主流搜索引擎簽署了《互聯(lián)網(wǎng)搜索引擎服務(wù)自律公約》,表態(tài)全部支持robots協(xié)議。搜索引擎支持robots協(xié)議,也就是在抓取網(wǎng)站內(nèi)容之前需要先抓取網(wǎng)站的robots.txt文件。

如果網(wǎng)站不設(shè)置robots.txt文件,正常情況下服務(wù)器會(huì)返回404狀態(tài)碼,但是也有些服務(wù)器會(huì)返回200或者其他錯(cuò)誤。針對(duì)返回404狀態(tài)碼的服務(wù)器,就不需要做特殊處理了。因?yàn)樗阉饕孀ト∫粌纱味及l(fā)現(xiàn)網(wǎng)站并沒(méi)有設(shè)置robots.txt文件,在一定周期內(nèi)就不會(huì)再進(jìn)行抓取了,而是正常抓取網(wǎng)站內(nèi)容。對(duì)于返回404狀態(tài)碼之外的信息的服務(wù)器,最好重新配置一下服務(wù)器,設(shè)置為對(duì)訪問(wèn)服務(wù)器上不存在的URL

或文件的用戶返回404狀態(tài)碼。如果不能進(jìn)行配置,那么就在網(wǎng)站根目錄下放一個(gè)空設(shè)置或允許抓取全部?jī)?nèi)容設(shè)置的robots.txt文件,以防服務(wù)器對(duì)Spider做出錯(cuò)誤的引導(dǎo)。

有些人認(rèn)為如果允許Spider抓取全站內(nèi)容,還在服務(wù)器上放一個(gè)robots.txt文件有可能會(huì)浪費(fèi)Spider的抓取次數(shù),畢竟Spider對(duì)一個(gè)網(wǎng)站的抓取次數(shù)是有限的。其實(shí)這種擔(dān)心是不必要的,不論你設(shè)置不設(shè)置robots.txt文件,搜索引擎都會(huì)頻繁地抓取這個(gè)文件,因?yàn)樗阉饕娌⒉恢滥阋院笫遣皇且O(shè)置或者更新這個(gè)文件,為了遵守互聯(lián)網(wǎng)協(xié)議,就只能頻繁地對(duì)此文件進(jìn)行抓取。并且搜索引擎每天只抓幾次robots.txt文件,并不會(huì)造成對(duì)網(wǎng)站抓取次數(shù)的浪費(fèi)。

2.不同搜索引擎對(duì)robots協(xié)議的支持并不相同

雖然主流搜索引擎都聲明支持robots協(xié)議,但是對(duì)于robots.txt文件中的限制語(yǔ)句可能會(huì)有不同的匹配解讀。在本書(shū)后續(xù)對(duì)Google Webmaster的“已攔截的網(wǎng)址”介紹中,介紹了百度和Google對(duì)

robots協(xié)議匹配不同的地方。即“Disallow:/tmp”在百度中是不可以匹配“/tmpdaf”的,但是在Google中是可以匹配的。所以站長(zhǎng)和SEO人員在配置robots.txt文件時(shí),需要特別注意一下,最好使用通用的屏蔽語(yǔ)句,或者研究幾個(gè)主流搜索引擎的官方幫助說(shuō)明,針對(duì)不同的搜索引擎進(jìn)行單獨(dú)的屏蔽設(shè)置。

3.robots.txt可以聲明網(wǎng)站地圖

robots.txt文件除了有限制搜索引擎抓取的功能外,還可以聲明網(wǎng)站地圖的位置。這其實(shí)是Google所支持的一個(gè)功能,站長(zhǎng)可以通過(guò)Google Webmaster直接向Google提交XML版本或純文本的網(wǎng)站地圖,也可以選擇在robots.txt文件中添加一行聲明:

Sitemap: http://example.com/Sitemap_location.xml


該聲明和限制搜索引擎抓取的語(yǔ)句沒(méi)有關(guān)系,可以放到文件中的任何位置。不過(guò)暫時(shí)只有Google支持,百度搜索工程師曾經(jīng)表示不支持(如圖5-8所示),并且現(xiàn)在百度在站長(zhǎng)平臺(tái)中有了專門(mén)的Sitemap提交入口,所以這個(gè)聲明對(duì)百度不一定有效。不過(guò)由于robots.txt文件的特性,搜索引擎都必須頻繁抓取此文件,所以在robots.txt文件中聲明一下網(wǎng)站地圖,單從促進(jìn)搜索引擎對(duì)網(wǎng)站抓取方面來(lái)看,只會(huì)有益無(wú)害。

圖5-8 百度表示不支持

4.robots meta 標(biāo)簽的使用

robots協(xié)議除可以在網(wǎng)站根目錄使用robots.txt文件外,還可以使用meta標(biāo)簽。具體寫(xiě)法如下:

<meta name="robots" content="nofollow"><meta name="BaiduSpider" content="nofollow"><meta name="robots" content="noarchive"><meta name="BaiduSpider" content="noarchive">
nofollow會(huì)在后面進(jìn)行詳細(xì)的介紹,noarchive是禁止顯示快照的意思,也就是當(dāng)網(wǎng)友搜索到你的網(wǎng)站時(shí),只能進(jìn)入你的網(wǎng)站瀏覽內(nèi)容,

不能通過(guò)搜索引擎的快照瀏覽你的網(wǎng)站的內(nèi)容。使用meta標(biāo)簽中的nofollow可以使得搜索引擎不跟蹤頁(yè)面中的鏈接。值得一提的是在網(wǎng)絡(luò)上和其他SEO書(shū)籍中提及的<meta name="robots"content="noindex">,百度是不支持的,在針對(duì)百度進(jìn)行設(shè)置時(shí),應(yīng)該了解并注意到這一點(diǎn)(不過(guò)筆者試驗(yàn)也有一定的效果)?,F(xiàn)在禁止百度收錄某個(gè)頁(yè)面只能使用robots.txt來(lái)實(shí)現(xiàn),或者針對(duì)百度Spider返回404狀態(tài)碼,robots meta暫時(shí)還不可以,不過(guò)百度官方表示已經(jīng)在計(jì)劃支持noindex。

5.robots.txt的具體用途

一般都說(shuō)可以使用robots.txt文件來(lái)屏蔽不想被搜索引擎抓取的頁(yè)面,但是這些“不想被抓取的頁(yè)面”一般都會(huì)有哪些呢?下面來(lái)舉幾個(gè)簡(jiǎn)單的例子。

(1)多版本URL情況下,非主顯URL的其他版本。比如網(wǎng)站鏈接偽靜態(tài)后就不希望搜索引擎抓取動(dòng)態(tài)版本了,這時(shí)就可以使用robots.txt屏蔽掉站內(nèi)所有動(dòng)態(tài)鏈接。

(2)如果網(wǎng)站內(nèi)有大量的交叉組合查詢所生成的頁(yè)面,肯定有大量頁(yè)面是沒(méi)有內(nèi)容的,對(duì)于沒(méi)有內(nèi)容的頁(yè)面可以單獨(dú)設(shè)置一個(gè)URL特征,然后使用robots.txt進(jìn)行屏蔽,以防被搜索引擎認(rèn)為網(wǎng)站制造垃圾頁(yè)面。

(3)如果網(wǎng)站改版或因?yàn)槟撤N原因突然刪除了大量頁(yè)面,眾所周知。網(wǎng)站突然出現(xiàn)大量死鏈接對(duì)網(wǎng)站在搜索引擎上的表現(xiàn)是不利的。

雖然現(xiàn)在可以直接向百度提交死鏈接,但是還不如直接屏蔽百度對(duì)死鏈接的抓取,這樣理論上百度就不會(huì)突然發(fā)現(xiàn)網(wǎng)站多了太多死鏈接,或者兩者同時(shí)進(jìn)行。當(dāng)然站長(zhǎng)自己最好把站內(nèi)的死鏈接清理干凈。

(4)如果網(wǎng)站有類(lèi)似UGC的功能,且為了提高用戶提供內(nèi)容的積極性并沒(méi)有禁止用戶在內(nèi)容中夾雜鏈接,此時(shí)為了不讓這些鏈接浪費(fèi)網(wǎng)站權(quán)重或牽連網(wǎng)站,就可以把這些鏈接做成站內(nèi)的跳轉(zhuǎn)鏈接,然后使robots.txt進(jìn)行屏蔽?,F(xiàn)在有不少論壇已經(jīng)這樣操作了。

(5)常規(guī)的不希望被搜索引擎索引的內(nèi)容,比如隱私數(shù)據(jù)、用戶信息、管理后臺(tái)頁(yè)面等都可以使用robots.txt進(jìn)行屏蔽。

以上就是robots.txt常見(jiàn)的功能。合理地使用robots.txt,不僅可以保護(hù)網(wǎng)站的隱私數(shù)據(jù),還可以只給搜索引擎展現(xiàn)網(wǎng)站高質(zhì)量的一面,同時(shí)也可以使得搜索引擎多多抓取其他允許抓取的頁(yè)面。不過(guò),站長(zhǎng)和SEO人員要慎重考慮是否需要把后臺(tái)地址寫(xiě)到robots.txt文件中,現(xiàn)在很多黑客都在頻繁地掃描各個(gè)網(wǎng)站的后臺(tái)地址,如果直接把后臺(tái)地址寫(xiě)入到robots.txt中,也就相當(dāng)于直接告訴黑客網(wǎng)站的后臺(tái)地址了;還有,現(xiàn)在只是Google支持robots.txt文件聲明Sitemap地址,百度并不支持,并且站長(zhǎng)現(xiàn)在完全可以通過(guò)Google Webmaster提交Sitemap,所以使用robots.txt文件聲明網(wǎng)站XML地圖位置并沒(méi)有太大的必要性。

現(xiàn)在有不少做采集的人都會(huì)通過(guò)robots.txt文件尋找網(wǎng)站的Sitemap,然后批量地提取目標(biāo)內(nèi)容的URL,如果站內(nèi)有比較有價(jià)值的資源(例如關(guān)鍵詞庫(kù)等),就很容易被競(jìng)爭(zhēng)對(duì)手鉆空子。所以在制作robots.txt

文件時(shí)一定要綜合考慮都需要寫(xiě)什么,而不能只站在SEO的角度思考問(wèn)題。

另外,SEO人員不要被robots.txt文件本身原始的作用所限制,要將思維擴(kuò)散一下,多多思考。比如為防止被搜索引擎抓到把柄,不讓馬可波羅網(wǎng)站首頁(yè)的多級(jí)導(dǎo)航。

圖5-10 馬可波羅網(wǎng)多級(jí)導(dǎo)航

3.底部導(dǎo)航

原本此導(dǎo)航一般是提供網(wǎng)站介紹、投訴舉報(bào)及聯(lián)系方式等網(wǎng)頁(yè)的入口。在網(wǎng)站注意做SEO工作之后,底部導(dǎo)航就會(huì)被添加上大量網(wǎng)站主推網(wǎng)頁(yè)或者站內(nèi)索引頁(yè)的鏈接。由于用戶對(duì)底部信息關(guān)注較少,底部導(dǎo)航就為SEO人員布局內(nèi)鏈提供了很大的空間。不過(guò)應(yīng)該注意底部導(dǎo)航鏈接個(gè)數(shù),如果太多頁(yè)面的底部導(dǎo)航代碼體積占網(wǎng)頁(yè)總體積過(guò)大,可能會(huì)被當(dāng)成站內(nèi)鏈接工廠,被搜索引擎認(rèn)定為無(wú)實(shí)際內(nèi)容的頁(yè)面,造成網(wǎng)頁(yè)不被收錄的情況。如圖5-11所示為馬可波羅網(wǎng)為產(chǎn)品庫(kù)索引和其他重要頁(yè)面索引做的底部導(dǎo)航;圖5-12為搜房網(wǎng)為各地區(qū)子站做的底部導(dǎo)航。



圖5-11 馬可波羅底部導(dǎo)航圖5-12 搜房網(wǎng)底部導(dǎo)航


4.面包屑導(dǎo)航

面包屑導(dǎo)航是網(wǎng)站不可或缺的。對(duì)用戶而言,可以讓用戶清楚地知道自己所瀏覽頁(yè)面在網(wǎng)站中的位置。對(duì)于SEO而言,保證了整站各級(jí)頁(yè)面結(jié)構(gòu)上權(quán)重的流通導(dǎo)向:網(wǎng)頁(yè)級(jí)別越高獲得的內(nèi)鏈支持越多,最底層的頁(yè)面在結(jié)構(gòu)上得到的內(nèi)鏈支持是最少的。

在進(jìn)行面包屑導(dǎo)航設(shè)計(jì)時(shí),如果網(wǎng)頁(yè)的上一級(jí)頁(yè)面不是很重要,在網(wǎng)站首頁(yè)已經(jīng)有入口了,那么其面包屑中的鏈接就可以nofollow掉,比如一些網(wǎng)站中的“其他”分類(lèi)。

如果一個(gè)網(wǎng)頁(yè)分屬兩個(gè)頻道,比如對(duì)于主題為“石家莊好利來(lái)”的頁(yè)面,可以通過(guò)地區(qū)分類(lèi)找到這個(gè)頁(yè)面,也可以通過(guò)食品分類(lèi)找到這個(gè)頁(yè)面,此時(shí)就可以為頁(yè)面設(shè)置雙面包屑導(dǎo)航,可以并排在網(wǎng)頁(yè)上方,也可以在網(wǎng)頁(yè)內(nèi)容的上下各設(shè)置一個(gè)。

如果當(dāng)前頁(yè)面是網(wǎng)站的子域名,那么最好不要把面包屑導(dǎo)航

圖5-13 58同城北京站面包屑導(dǎo)航

的第一級(jí)設(shè)置為網(wǎng)站的首頁(yè),而要設(shè)置為子域名的首頁(yè)。一般主導(dǎo)航或者Logo上都會(huì)有網(wǎng)站首頁(yè)的鏈接,沒(méi)必要為其再增加一個(gè)鏈接了。如圖5-13所示為58同城北京站的面包屑導(dǎo)航。

最后再?gòu)?qiáng)調(diào)一點(diǎn),網(wǎng)站導(dǎo)航最好都使用普通文本鏈接形式,不要使用Flash,JS,框架和Ajax等不利于Spider抓取的形式。如果為了美觀必須使用特殊的形式,那么在網(wǎng)頁(yè)的其他地方,比如底部導(dǎo)航中做好文本導(dǎo)航鏈接。其實(shí)稍有SEO經(jīng)驗(yàn)的朋友對(duì)此都熟記于心了,不過(guò)現(xiàn)在的確還有不少企業(yè)站和一些老牌地方新聞網(wǎng)站使用非文本鏈接的

形式。

《百度搜索引擎優(yōu)化指南》對(duì)于網(wǎng)站導(dǎo)航的建議如下。

(1)為每個(gè)頁(yè)面都加上導(dǎo)航欄,讓用戶可以方便地返回頻道、網(wǎng)站首頁(yè),也可以讓搜索引擎方便地定位網(wǎng)頁(yè)在網(wǎng)站結(jié)構(gòu)中的層次;(2)內(nèi)容較多的網(wǎng)站,建議使用面包屑式的導(dǎo)航,這更容易讓用戶理解當(dāng)前所處的位置。例如:網(wǎng)站首頁(yè) > 頻道 > 當(dāng)前瀏覽頁(yè)面;(3)導(dǎo)航中使用文字鏈接,不使用復(fù)雜的Js或者Flash;(4)使用圖片做導(dǎo)航時(shí),可以使用Alt注釋,用Alt告訴搜索引擎所指向的網(wǎng)頁(yè)內(nèi)容是什么。

其中第(4)條“使用圖片做導(dǎo)航時(shí),可以使用Alt注釋,用Alt告訴搜索引擎所指向的網(wǎng)頁(yè)內(nèi)容是什么”,原來(lái)筆者以為這一點(diǎn)有誤,但向百度站長(zhǎng)平臺(tái)PM求證了“圖片導(dǎo)航鏈接中的圖片ALT有描述鏈接的作用”。不知道百度會(huì)不會(huì)對(duì)導(dǎo)航類(lèi)的鏈接單獨(dú)處理,不過(guò)理論上說(shuō)對(duì)于圖片鏈接,Alt是對(duì)圖片的描述,也就是圖片的內(nèi)容,鏈接錨文本和Title屬性才是對(duì)鏈接的描述,不過(guò)Alt也可以間接描述鏈接。

站在SEO對(duì)鏈接進(jìn)行描述的角度,筆者更加傾向于標(biāo)簽回歸本意:使用鏈接Title來(lái)對(duì)鏈接進(jìn)行描述,導(dǎo)航上的圖片本身沒(méi)有多少含義,沒(méi)有必要設(shè)置Alt,但是為了防止圖片加載失敗而讓用戶對(duì)鏈接感到迷惑,還是有必要為圖片設(shè)置Alt的。當(dāng)然最好是直接使用文本鏈接,如果必須使用圖片導(dǎo)航,那么圖片Alt和鏈接Title就都設(shè)置上吧。

5.1.5 Cookie、登錄瀏覽與SEO沖突的解決方法

有些網(wǎng)站為了記錄用戶在站內(nèi)的瀏覽行為,會(huì)強(qiáng)制為用戶瀏覽器設(shè)置Cookie,但是搜索引擎的Spider是不支持Cookie的,此時(shí)就可能導(dǎo)致搜索引擎無(wú)法正常抓取網(wǎng)站的內(nèi)容。

有些網(wǎng)站(多見(jiàn)于論壇)為防止網(wǎng)站內(nèi)容被采集,或者出于其他考慮,會(huì)設(shè)置必須登錄才能瀏覽網(wǎng)站內(nèi)容。然而搜索引擎的Spider是不可能自動(dòng)注冊(cè)和登入網(wǎng)站的,此時(shí)就會(huì)造成搜索引擎無(wú)法正常抓取網(wǎng)站內(nèi)容。有不少論壇因此設(shè)置導(dǎo)致網(wǎng)站收錄量下降,搜索引擎流量丟失。

對(duì)于以上這兩種情況,最好的方式就是對(duì)搜索引擎進(jìn)行單獨(dú)瀏覽設(shè)置,允許搜索引擎的Spider不生成Cookie即可瀏覽網(wǎng)站內(nèi)容。對(duì)于第二種強(qiáng)制登錄的情況,其實(shí)還可以設(shè)置讓非登錄用戶瀏覽部分內(nèi)容,如果需要瀏覽全部?jī)?nèi)容,則必須注冊(cè)和登錄,這樣也可以使得搜索引擎正常抓取收錄和排名,也不會(huì)通過(guò)快照泄露網(wǎng)站內(nèi)容,還可以促進(jìn)目標(biāo)流量用戶的注冊(cè)。如圖5-14所示為知乎網(wǎng)站之前的設(shè)置,非登錄用戶只可以瀏覽問(wèn)題標(biāo)題和一個(gè)出色的回答,但是想要瀏覽更多精彩的回帖內(nèi)容就必須注冊(cè)登錄了。內(nèi)容下方直接給出了注冊(cè)界面,既保證了搜索引擎的正常收錄和排名,又提高了搜索流量轉(zhuǎn)化成注冊(cè)用戶的轉(zhuǎn)化率。雖然當(dāng)初知乎如此設(shè)置的出發(fā)點(diǎn)并不是SEO,但這不失為一個(gè)優(yōu)秀的SEO策略。


圖5-14 知乎網(wǎng)站設(shè)置


5.1.6 翻頁(yè)注意事項(xiàng)

翻頁(yè)一般出現(xiàn)于列表分頁(yè)和內(nèi)容分頁(yè)兩個(gè)地方。

1.不要盲目改變列表分頁(yè)

正常的網(wǎng)站中,翻頁(yè)是必不可少的事,有的網(wǎng)站部分分類(lèi)中的信息列表可能有幾千個(gè)分頁(yè)。分頁(yè)過(guò)多就可能對(duì)Spider對(duì)網(wǎng)站的抓取造成障礙。如果網(wǎng)站更新頻率并不是很快,分頁(yè)過(guò)多是由長(zhǎng)時(shí)間積累下來(lái)的,列表中的內(nèi)容幾乎都被Spider抓取過(guò)了,這樣是沒(méi)有太大問(wèn)題的。但是對(duì)于每天更新量比較大的網(wǎng)站或者網(wǎng)站目錄,每天可能就有超過(guò)幾十分頁(yè)列表內(nèi)容或信息產(chǎn)生,此時(shí)就為Spider對(duì)網(wǎng)站內(nèi)容的抓取造成了障礙。

如圖5-15所示為一個(gè)分類(lèi)信息網(wǎng)站的分頁(yè),如果該分類(lèi)每天發(fā)布的信息超過(guò)了10頁(yè),Spider要對(duì)10頁(yè)之后的新信息進(jìn)行抓取,就必須翻到第10頁(yè)才能提取到之后的分頁(yè)URL,越靠后的分頁(yè)越難獲取。所以為了方便搜索引擎對(duì)分頁(yè)內(nèi)容的抓取,可以把分頁(yè)做成下面兩種格式:

1,2,3,4,5,6,7,8,9,10,11,21,31…

1,2,3,4,5,6,7,8,9,10,下10頁(yè)

圖5-15 分類(lèi)信息網(wǎng)站的分頁(yè)

也可以根據(jù)網(wǎng)站類(lèi)型進(jìn)行按日期歸檔形式的分頁(yè)。將每天的內(nèi)容或信息做一個(gè)歸檔,對(duì)歸檔內(nèi)的信息再進(jìn)行分頁(yè),這樣就可以使Spider比較方便地抓取網(wǎng)站的新內(nèi)容了。如圖5-16所示為八方資源網(wǎng)供應(yīng)商頻道列表中使用的歸檔形式。

圖5-16 八方資源網(wǎng)站供應(yīng)商列表歸檔

注意到網(wǎng)絡(luò)上有不少帖子在極力推薦使用這種格式的分頁(yè),但是如果網(wǎng)站每天更新的信息都不夠一頁(yè)列表,普通正常的分頁(yè)就可以了,沒(méi)有必要刻意追求這種格式。這種格式的目的是讓Spider方便地抓取每天的新內(nèi)容,如果Spider都已經(jīng)可以方便地抓取了,還跟風(fēng)麻煩技術(shù)人員干嘛呢?作為SEO人員應(yīng)該明白每一種改動(dòng)和設(shè)置的原理,而不是盲目跟風(fēng)。在SEO中任何策略都是有適用前提的。

一般網(wǎng)站會(huì)有主目錄和其他條件的聚合列表。主目錄的主要目的是為了讓Spider方便抓取全站內(nèi)容,列表首頁(yè)也有競(jìng)爭(zhēng)關(guān)鍵詞排名的作用;聚合列表一般只需要首頁(yè)來(lái)競(jìng)爭(zhēng)排名。所以以上翻頁(yè)的改動(dòng)是針對(duì)主目錄的,聚合列表的翻頁(yè)鏈接可以全部nofollow掉或者使用JS調(diào)用,甚至直接不給分頁(yè)。沒(méi)有必要為Spider設(shè)置多個(gè)入口抓取網(wǎng)站內(nèi)容,同時(shí)也可以減少不必要的權(quán)重浪費(fèi)。

2.注意首頁(yè)和“第1頁(yè)”

不少網(wǎng)站都存在這個(gè)問(wèn)題:列表首頁(yè)的URL是一個(gè)目錄,但是首頁(yè)的內(nèi)容和列表第1頁(yè)是完全一樣的,并且兩個(gè)URL在站內(nèi)是并存的,這就出現(xiàn)了URL規(guī)范化的問(wèn)題。此時(shí)一般有兩種解決辦法,一種是把分頁(yè)第1頁(yè)301到列表首頁(yè)的URL上,或者直接把所有分頁(yè)第1頁(yè)的鏈接直接使用列表首頁(yè)的URL,使第1頁(yè)的URL(類(lèi)似“/pn1”)不出現(xiàn)在網(wǎng)站中;第二種是為列表首頁(yè)單獨(dú)設(shè)計(jì)一個(gè)頁(yè)面,和列表第1頁(yè)的內(nèi)容不重復(fù)。兩種方法都可以解決這個(gè)問(wèn)題,第一種方法稍微簡(jiǎn)單一些,也是最常見(jiàn)的,但是第二種方法可以布局更多的關(guān)鍵詞,首頁(yè)和列表頁(yè)第一頁(yè)都可以獲得比較多的內(nèi)鏈權(quán)重,從而可以擁有承擔(dān)更多關(guān)鍵詞排名的能力。

3.不要浪費(fèi)內(nèi)容翻頁(yè)

有不少網(wǎng)站為了增加網(wǎng)站PV,會(huì)為一篇文章設(shè)置大量的分頁(yè),但是這些分頁(yè)的標(biāo)題不是全部一模一樣就是只在首頁(yè)標(biāo)題的后面加了一個(gè)頁(yè)碼。能被搜索引擎收錄和排名的幾乎只有文章第1頁(yè)。由于各分頁(yè)的內(nèi)容不同,標(biāo)題卻相同,因此雖然搜索引擎可能會(huì)識(shí)別分頁(yè),但是網(wǎng)站卻浪費(fèi)了更多收錄和排名機(jī)會(huì)。因?yàn)楦鞣猪?yè)的內(nèi)容并不相同,所以完全可以為每個(gè)分頁(yè)做一個(gè)不同的標(biāo)題,這樣不僅可以吸引用戶瀏覽分頁(yè)的內(nèi)容,同時(shí)各個(gè)分頁(yè)也可以作為獨(dú)立的頁(yè)面做不同關(guān)鍵詞的排名。如圖5-17所示為老牌手機(jī)門(mén)戶網(wǎng)站TOMPDA的新聞翻頁(yè)設(shè)置,其實(shí)分頁(yè)的標(biāo)題還可以重新設(shè)計(jì)一下,比如把當(dāng)前分頁(yè)的關(guān)鍵詞提前。



圖5-17 TOMPDA文章翻頁(yè)

5.1.7 Flash、框架、JS及Ajax問(wèn)題及反向使用

眾所周知,這4個(gè)東西對(duì)搜索引擎是不友好的,雖然搜索引擎一直在嘗試抓取這4個(gè)東西內(nèi)部的內(nèi)容,但是目前看來(lái)效果并不是很好,所以一般在網(wǎng)站中要盡可能地少使用這些東西調(diào)用內(nèi)容。如圖5-18所示,在百度站長(zhǎng)平臺(tái)的“頁(yè)面優(yōu)化建議”中有專門(mén)針對(duì)Flash和框架的檢測(cè),如果頁(yè)面含有框架就會(huì)予以相應(yīng)的提醒。這里值得一提的是百度現(xiàn)在對(duì)JS中的URL會(huì)有比較頻繁的抓取,但是給不給權(quán)重就不得而知了。

圖5-18 百度站長(zhǎng)平臺(tái)“頁(yè)面優(yōu)化建議”框架部分

其實(shí)并不是這些東西對(duì)搜索引擎不友好,站在SEO角度這些技術(shù)就一無(wú)是處了。在網(wǎng)站運(yùn)營(yíng)過(guò)程中,并不是唯SEO馬首是瞻,很多時(shí)候并沒(méi)有可以替代這些技術(shù)的方法,就不得不使用了。還有在網(wǎng)站運(yùn)營(yíng)過(guò)程中,各類(lèi)頁(yè)面上所調(diào)用的東西很多對(duì)SEO是沒(méi)有作用的,它們是為了讓用戶瀏覽的,且并不是站內(nèi)的所有頁(yè)面都可以參加搜索引擎排名搶奪流量,總有一些不適合獲得搜索流量的內(nèi)容頁(yè)面。站在SEO角度,對(duì)于這些頁(yè)面是沒(méi)有必要導(dǎo)給它們鏈接浪費(fèi)權(quán)重的,此時(shí)可以針對(duì)這些鏈接使用nofollow,但是也可以使用JS、框架及Flash來(lái)調(diào)用這些內(nèi)容或鏈接,這不但不影響用戶的瀏覽,還會(huì)降低當(dāng)前網(wǎng)頁(yè)的體積,提升頁(yè)面的信噪比,使得網(wǎng)頁(yè)主體內(nèi)容更加突出,甚至可以影響到網(wǎng)頁(yè)關(guān)鍵詞的密度,從而獲得正向的作用。

有些大型網(wǎng)站的頻道是外包性質(zhì)的,外包頻道或者網(wǎng)站主體在網(wǎng)站主導(dǎo)行部分就使用了JS或框架。如圖5-19和圖5-20所示分別為銀河網(wǎng)IT頻道的頂部導(dǎo)航和對(duì)應(yīng)的源代碼,此網(wǎng)站就使用了框架。

圖5-19 銀河網(wǎng)IT頻道頂部導(dǎo)航



圖5-20 銀河網(wǎng)IT頻道頂部導(dǎo)航源代碼

所以JS、框架和Flash并不絕對(duì)是SEO的敵人,它們也可以是SEO的朋友?,F(xiàn)在有人研究,通過(guò)技術(shù)也可以使得Ajax對(duì)搜索引擎友好了,有興趣的朋友可以百度一下。

《百度搜索引擎優(yōu)化指南》給出的網(wǎng)站機(jī)器可讀方面的建議為:

(1)使用文字而不是Flash、圖片、JavaScript等來(lái)顯示重要的內(nèi)容或鏈接;(2)如果必須使用Flash制作網(wǎng)頁(yè),建議同時(shí)制作一個(gè)供搜索引擎收錄的文字版,并在首頁(yè)使用文本鏈接指向文字版;(3)Ajax等搜索引擎不能識(shí)別的技術(shù),只用在需要用戶交互的地方,不把希望搜索引擎“看”到的導(dǎo)航及正文內(nèi)容放到Ajax中;(4)不使用frame和iframe框架結(jié)構(gòu),通過(guò)iframe顯示的內(nèi)容可能會(huì)被百度丟棄。

5.1.8 內(nèi)鏈優(yōu)化注意事項(xiàng)

有不少網(wǎng)站根本不做外鏈,只在內(nèi)容上發(fā)力,配合優(yōu)秀的內(nèi)鏈設(shè)計(jì)就把網(wǎng)站的SEO做得很好,在搜索引擎上獲得極高的權(quán)重和流量。

內(nèi)鏈的優(yōu)化也是一個(gè)很大的話題,不同類(lèi)型的網(wǎng)站、不同類(lèi)型的內(nèi)容都會(huì)有不同的內(nèi)鏈優(yōu)化方法。下面簡(jiǎn)單談一下內(nèi)鏈優(yōu)化應(yīng)該注意的地方。

1.樹(shù)形邏輯內(nèi)鏈設(shè)計(jì)到位

網(wǎng)站的主導(dǎo)航、多級(jí)導(dǎo)航和面包屑導(dǎo)航做到位,這部分不用極力想辦法做出花兒來(lái)。主導(dǎo)航和多級(jí)導(dǎo)航使得網(wǎng)站內(nèi)重要頻道、分類(lèi)或內(nèi)容入口得到推薦即可;面包屑導(dǎo)航只要按照正常的樹(shù)形結(jié)構(gòu)布局就好,這樣最起碼就從大體結(jié)構(gòu)上做好了內(nèi)鏈,其他的就是補(bǔ)充性的內(nèi)

鏈了。例如同類(lèi)頁(yè)面和上下級(jí)頁(yè)面,不論從用戶體驗(yàn)角度出發(fā),還是從SEO角度出發(fā),都要搭建起合理相關(guān)的鏈接結(jié)構(gòu),做成完全的大樹(shù)形鏈接結(jié)構(gòu)。

比如對(duì)于有地區(qū)分類(lèi)的網(wǎng)站,一般從首頁(yè)需要看到省和直轄市的鏈接,省級(jí)頁(yè)面需要看到地市頁(yè)面的鏈接,從地市頁(yè)面需要看到區(qū)縣頁(yè)面的鏈接,甚至同級(jí)地區(qū)之間也需要互鏈。這只是一維的鏈接層級(jí),如果網(wǎng)站內(nèi)容有多維的分類(lèi),那么組合頁(yè)面的鏈接設(shè)計(jì)也需要認(rèn)真研究,因?yàn)榘凑照_壿嬯P(guān)系組合頁(yè)面需要推薦的鏈接太多,這時(shí)就要根據(jù)需要或者頁(yè)面重要性為內(nèi)鏈做減法。另外有些重要頁(yè)面往往會(huì)進(jìn)行隔級(jí)推薦,這個(gè)“重要頁(yè)面”的篩選也需要根據(jù)網(wǎng)站運(yùn)營(yíng)情況和SEO需求進(jìn)行綜合選取。不同網(wǎng)站都會(huì)設(shè)計(jì)不同的邏輯內(nèi)鏈結(jié)構(gòu),

SEO人員可以多看看同類(lèi)網(wǎng)站的主要導(dǎo)航內(nèi)鏈設(shè)計(jì)。

2.內(nèi)鏈布局的位置

在正常的網(wǎng)站結(jié)構(gòu)設(shè)計(jì)中就有了內(nèi)鏈的布局。除各類(lèi)網(wǎng)頁(yè)主體內(nèi)容部分自然的內(nèi)鏈外,還可以在主體內(nèi)容的周?chē)爸黧w內(nèi)容中布局內(nèi)鏈。比如文章左右及下方的推薦文章,文章內(nèi)部的錨文本鏈接、頁(yè)面底部類(lèi)友情鏈接的形式等。甚至有的網(wǎng)站為了增加內(nèi)鏈,又不想把鏈接都陳列出來(lái)干擾用戶,就會(huì)在合適的位置設(shè)置鼠標(biāo)劃過(guò)時(shí)彈出的形式布局內(nèi)鏈。

此處需要了解的是,搜索引擎是可以判斷出大部分網(wǎng)頁(yè)上的“內(nèi)容塊”“鏈接塊”“評(píng)論塊”等模塊的,一般根據(jù)HTML標(biāo)簽、內(nèi)容長(zhǎng)度、所在位置等因素使用比較復(fù)雜的“投票方法”進(jìn)行識(shí)別區(qū)分,每種“塊”中的內(nèi)容對(duì)于判斷當(dāng)前頁(yè)的內(nèi)容和主題關(guān)鍵詞都有不同的權(quán)重;同樣,每種“塊”中的鏈接為鏈向頁(yè)面導(dǎo)出的權(quán)重和“說(shuō)明意義”也是不同的。內(nèi)容中“自然”出現(xiàn)的鏈接要比內(nèi)容周?chē)扑]鏈接的作用好很多。

3.內(nèi)容頁(yè)均衡的內(nèi)鏈

現(xiàn)在大部分網(wǎng)站的內(nèi)容頁(yè)所獲得的鏈接,除來(lái)自首頁(yè)、目錄頁(yè)和專題頁(yè)等上層頁(yè)面外,內(nèi)容頁(yè)也會(huì)推薦一部分其他內(nèi)容頁(yè)的鏈接。現(xiàn)在常見(jiàn)的兩種推薦形式為“相關(guān)文章/信息”和“最新文章/信息”。

“相關(guān)”一般使用站內(nèi)搜索來(lái)匹配??梢运阕鍪窍嚓P(guān)內(nèi)鏈,但是這個(gè)內(nèi)鏈的匹配質(zhì)量和站內(nèi)搜索的水平有直接關(guān)系,A網(wǎng)站和B網(wǎng)站都有相關(guān)推薦,但是推薦的鏈接質(zhì)量及相關(guān)性并不同,這涉及站內(nèi)詞庫(kù)和排序設(shè)置規(guī)則的問(wèn)題,小團(tuán)隊(duì)一般不容易解決這個(gè)問(wèn)題,此處只能是有勝于無(wú),當(dāng)然對(duì)于自有編輯編寫(xiě)文章的網(wǎng)站,完全可以使用人工選擇推薦其他相關(guān)文章,一般質(zhì)量也會(huì)不錯(cuò)。

這里再重點(diǎn)說(shuō)一下“最新”。首頁(yè)、目錄頁(yè)和專題頁(yè)等頁(yè)面所能推薦的內(nèi)容頁(yè)終歸是有限的,一般都是推薦站內(nèi)最新的內(nèi)容頁(yè),目錄頁(yè)的分頁(yè)對(duì)內(nèi)容頁(yè)的推薦是遠(yuǎn)遠(yuǎn)不夠的,并且搜索引擎對(duì)分頁(yè)的抓取一直都不是很好。如果網(wǎng)站所有內(nèi)容頁(yè)都類(lèi)似于新聞網(wǎng)站生成HTML文件,此時(shí)內(nèi)容頁(yè)對(duì)“最新”的其他內(nèi)容頁(yè)推薦是比較健康的。每個(gè)內(nèi)容頁(yè)所推薦的其他最新內(nèi)容頁(yè),都是當(dāng)前內(nèi)容頁(yè)發(fā)布時(shí)的“最新”內(nèi)容,由于已經(jīng)生成靜態(tài)HTML文件,一般不會(huì)再進(jìn)行更新,所以這種形式的網(wǎng)站的每個(gè)內(nèi)容頁(yè)都可以獲得固定長(zhǎng)期的其他內(nèi)容頁(yè)的推薦,即使網(wǎng)站沒(méi)有目錄頁(yè),用戶和Spider只是利用內(nèi)容頁(yè)的“最新”推薦也能把整站的內(nèi)容瀏覽一遍。

如果網(wǎng)站所有頁(yè)面都是數(shù)據(jù)庫(kù)驅(qū)動(dòng)的動(dòng)態(tài)頁(yè)面,頁(yè)面中的“最新”推薦一般會(huì)有一個(gè)更新周期,也就是說(shuō)宏觀來(lái)看,所有內(nèi)容頁(yè)中所推薦的“最新內(nèi)容”都是網(wǎng)站中最新發(fā)布的內(nèi)容,這也就造成了之前發(fā)布的大量?jī)?nèi)容只能從目錄列表很靠后的分頁(yè)中找到鏈接,也就是說(shuō)絕大多數(shù)的內(nèi)容頁(yè)其實(shí)慢慢地就鮮有內(nèi)鏈了。并且站內(nèi)所有內(nèi)容頁(yè)都只推薦那幾篇最新內(nèi)容頁(yè),也有些資源浪費(fèi)。此時(shí)如果想讓站內(nèi)內(nèi)容頁(yè)得到均衡、固定、長(zhǎng)期的內(nèi)鏈支持,就可以根據(jù)內(nèi)容頁(yè)的數(shù)據(jù)庫(kù)ID來(lái)推薦當(dāng)前內(nèi)容頁(yè)在數(shù)據(jù)庫(kù)表中前后的幾篇內(nèi)容頁(yè),以實(shí)現(xiàn)每個(gè)內(nèi)容頁(yè)都固定均衡、得到一定量的內(nèi)鏈。當(dāng)然如果為了使得所有內(nèi)容頁(yè)的訪問(wèn)用戶都可以第一時(shí)間關(guān)注站內(nèi)最新的內(nèi)容,那么以上這種內(nèi)鏈推薦,也可以使用其他的名稱出現(xiàn),比如“小編推薦”之類(lèi)的名字,想做總會(huì)有辦法的。這種鏈接使用文章標(biāo)題作為錨文本,還是使用文章定位的關(guān)鍵詞作為錨文本,都是有很大操作空間的,有興趣的朋友可以深入研究一下。

4.內(nèi)鏈一定要相關(guān)

這里的“相關(guān)”并不是簡(jiǎn)單聚合一下就可以了。要站在用戶的角度考慮這些推薦的文章或頻道目錄的鏈接是否與當(dāng)前頁(yè)面的內(nèi)容主題相關(guān),看完本頁(yè)的內(nèi)容之后是否有點(diǎn)擊瀏覽其他相關(guān)頁(yè)面的欲望。能夠正常引起用戶點(diǎn)擊瀏覽欲望的相關(guān)推薦鏈接才算真正相關(guān),依靠色情類(lèi)標(biāo)題或圖片吸引點(diǎn)擊的鏈接不算。此時(shí)必須是內(nèi)容相關(guān)或者話題相同,鏈接兩頭的頁(yè)面要內(nèi)容或邏輯相關(guān),要具有補(bǔ)充或延伸瀏覽的作用。

舉個(gè)例子,假設(shè)有個(gè)頁(yè)面的主題為“濟(jì)南瑪索酒吧”,那么相關(guān)推薦的鏈接就應(yīng)該有濟(jì)南的其他酒吧,也可以有其他地方的瑪索相關(guān)頁(yè)面。此頁(yè)面文本內(nèi)容中有“百利甜酒”的介紹,就可以為“百利甜酒”加上相應(yīng)的鏈接。這種當(dāng)能夠吸引用戶瀏覽完本頁(yè)的內(nèi)容后,繼續(xù)瀏覽其他頁(yè)面的內(nèi)鏈,才算是最好的內(nèi)鏈。例如,本頁(yè)內(nèi)容中有一句“從***開(kāi)車(chē)40分鐘即到”,而站內(nèi)有關(guān)于“車(chē)”的頻道或內(nèi)容,這種情況并不適合添加鏈接,因?yàn)閮蓚€(gè)頁(yè)面內(nèi)容并不相關(guān),并不會(huì)引起用戶點(diǎn)擊瀏覽的欲望,即使加了鏈接也幾乎無(wú)效。

然而現(xiàn)在大家的操作都是本著有總比沒(méi)有強(qiáng)的想法。現(xiàn)在網(wǎng)站做內(nèi)鏈,幾乎都是以關(guān)鍵詞為主,不管內(nèi)容相關(guān)不相關(guān),只要內(nèi)容中出現(xiàn)了這個(gè)詞,就給它加上鏈接,這是自動(dòng)生成的一種鏈接結(jié)構(gòu)。不能說(shuō)這種鏈接對(duì)網(wǎng)站SEO沒(méi)有積極作用,只能說(shuō)并沒(méi)有起到最佳的作用,也不是搜索引擎所倡導(dǎo)的“具有推薦意義的鏈接”?,F(xiàn)在常見(jiàn)的“相關(guān)”鏈接推薦方法還有一種是使用搜索實(shí)現(xiàn),即用當(dāng)前頁(yè)面的title

或特證詞去搜索相關(guān)鏈接,但是用“詞搜詞”本身就會(huì)有很大的不準(zhǔn)確性。對(duì)于有一定規(guī)模的網(wǎng)站,這里推薦有能力的朋友簡(jiǎn)單了解一下使用TF*IDF、聚類(lèi)及相關(guān)擴(kuò)展算法和思路來(lái)嘗試實(shí)現(xiàn)站內(nèi)鏈接的“相關(guān)”,只是了解方法就好,具體實(shí)現(xiàn)一般只能去折騰技術(shù)人員了;針對(duì)小型網(wǎng)站,其實(shí)站在網(wǎng)站用戶的角度使用人工配置的內(nèi)鏈?zhǔn)亲钭匀坏摹?/p>

5.錨文本的控制

如果一個(gè)網(wǎng)頁(yè)只有一個(gè)主要關(guān)鍵詞,那么關(guān)于這個(gè)頁(yè)面鏈接的錨文本統(tǒng)一用一個(gè)就可以了。如果一個(gè)網(wǎng)頁(yè)定位了幾個(gè)關(guān)鍵詞,那么就要好好設(shè)計(jì)內(nèi)鏈的錨文本了。首先要選定都從哪些頁(yè)面給這個(gè)頁(yè)面導(dǎo)鏈接,而后要根據(jù)導(dǎo)出鏈接頁(yè)面的內(nèi)容選擇被鏈接頁(yè)面的錨文本。對(duì)于單個(gè)頁(yè)面來(lái)說(shuō)這樣做是比較簡(jiǎn)單的,但是對(duì)于整站來(lái)操作就比較困難了,需要SEO人員和技術(shù)人員根據(jù)網(wǎng)站情況進(jìn)行實(shí)際討論。

現(xiàn)在有種簡(jiǎn)單但不是最佳思路的方法:在挖掘、分類(lèi)并布局關(guān)鍵詞后,一般每個(gè)著陸頁(yè)都會(huì)對(duì)應(yīng)幾個(gè)關(guān)鍵詞,那么就可以做出一個(gè)大表來(lái),每個(gè)關(guān)鍵詞都對(duì)應(yīng)一個(gè)著陸頁(yè)鏈接,然后把這個(gè)大表做成錨文本鏈接的形式,添加到全網(wǎng)站各個(gè)網(wǎng)頁(yè)的頁(yè)腳上。使用程序控制,設(shè)定哪些重要頁(yè)面和熱門(mén)關(guān)鍵詞得到的鏈接多,哪些冷門(mén)頁(yè)面和長(zhǎng)尾關(guān)鍵詞得到的鏈接少,每個(gè)頁(yè)面上添加的鏈接不超過(guò)30個(gè)(數(shù)量憑自己感覺(jué)控制),當(dāng)前網(wǎng)頁(yè)不添加當(dāng)前頁(yè)的鏈接等。這樣就可以使自己所布局的關(guān)鍵詞和著陸頁(yè)都得到一定的內(nèi)鏈支持,來(lái)促進(jìn)著陸頁(yè)和定位關(guān)鍵詞的相關(guān)度,提升網(wǎng)頁(yè)權(quán)重。因?yàn)檫@樣操作,不能?chē)?yán)格控制錨文本和當(dāng)前網(wǎng)頁(yè)的相關(guān)性,所以鏈接效果并不是最佳的。

如果有一定的技術(shù)或時(shí)間,可以對(duì)錨文本進(jìn)行分類(lèi),或根據(jù)網(wǎng)站內(nèi)容語(yǔ)義分析對(duì)錨文本直接進(jìn)行關(guān)聯(lián)性串聯(lián),從而提升布局的錨文本和當(dāng)前頁(yè)定位關(guān)鍵詞之間的相關(guān)性,提升內(nèi)鏈質(zhì)量。對(duì)于海量錨文本內(nèi)鏈的質(zhì)量控制,往往和網(wǎng)站的內(nèi)容詞庫(kù)分析能力有關(guān),有興趣的朋友可以深入地研究和試驗(yàn)一下。

6.內(nèi)鏈雖好,但是不要貪多

這一點(diǎn)就不用多說(shuō)了,同一個(gè)頁(yè)面鏈接過(guò)多,每個(gè)鏈接獲得的權(quán)重就越少,這是大家都知道的。并且在前面一再?gòu)?qiáng)調(diào),站內(nèi)頁(yè)面堆砌太多內(nèi)鏈,也可能會(huì)被當(dāng)做站內(nèi)鏈接農(nóng)場(chǎng)處理,因?yàn)榇蟛糠猪?yè)面的主要內(nèi)容都是鏈接了,沒(méi)有實(shí)質(zhì)性的內(nèi)容提供給用戶。

針對(duì)不同的網(wǎng)站,內(nèi)鏈都會(huì)有不同的操作空間和設(shè)計(jì)方式,內(nèi)鏈永遠(yuǎn)是值得SEO人員深入挖掘的地方。在此附上《百度搜索引擎優(yōu)化指南》一書(shū)中的相關(guān)建議:

(1)確保每個(gè)頁(yè)面都可以通過(guò)至少一個(gè)文本鏈接到達(dá);(2)重要的內(nèi)容,應(yīng)該能從首頁(yè)或者網(wǎng)站結(jié)構(gòu)中比較淺的層次訪問(wèn)到;(3)合理分類(lèi)網(wǎng)站上的內(nèi)容,不要過(guò)度細(xì)分。

5.1.9 nofollow相關(guān)問(wèn)題和使用

nofollow是鏈接的HTML標(biāo)簽屬性,站長(zhǎng)和SEO人員可以通過(guò)這個(gè)屬性來(lái)告訴搜索引擎不要追蹤此網(wǎng)頁(yè)上的鏈接,或不要追蹤某個(gè)指定的鏈接,這些或這個(gè)鏈接并不是本網(wǎng)站所推薦的。鏈接一旦使用

nofollow之后,就不會(huì)導(dǎo)出權(quán)重了。

1.關(guān)于nofollow的爭(zhēng)議

有段時(shí)間Zac和國(guó)平有過(guò)關(guān)于nofollow的爭(zhēng)議,就是nofollow到底會(huì)不會(huì)浪費(fèi)PR。按照Google官方人員的解釋,假設(shè)一個(gè)頁(yè)面上有10

個(gè)鏈接,那么該頁(yè)面的PR就會(huì)被分成10份分給這些鏈接,如果其中有一個(gè)鏈接是nofollow的,那么相對(duì)應(yīng)的PR就不導(dǎo)出了,至于應(yīng)該導(dǎo)給這個(gè)鏈接的PR到底去哪兒了并不知道。因?yàn)榘凑战忉寔?lái)看,應(yīng)該分給被nofollow鏈接的PR并沒(méi)有分給其他未被nofollow的鏈接。因?yàn)閷?duì)原始文章的解讀不同,所以才有了爭(zhēng)議。

2.百度如何支持nofollow

上面的爭(zhēng)議只是針對(duì)Google的,百度并不一定是按照Google的方式進(jìn)行處理的。2010年7月百度搜索工程師LEE在“百度站長(zhǎng)俱樂(lè)部”回應(yīng)百度支持nofollow(如圖5-21所示),但是并沒(méi)有說(shuō)明到底怎么支持nofollow,應(yīng)該分配給被nofollow的鏈接權(quán)重是不是也和Google一樣浪費(fèi)了。如果真的是浪費(fèi)了,那么對(duì)站內(nèi)鏈接就最好不要使用了,為什么要對(duì)自己站內(nèi)鏈接浪費(fèi)權(quán)重呢?

圖5-21 LEE首次回應(yīng)支持nofollow

在2012年10月26日晚上的“百度站長(zhǎng)平臺(tái)-高端SEO俱樂(lè)部”沙龍中,筆者當(dāng)面向LEE詢問(wèn)百度對(duì)nofollow的支持方式。LEE表示應(yīng)該分給被nofollow鏈接的權(quán)重會(huì)被分配到其他未被nofollow的鏈接上去。所以現(xiàn)在對(duì)站內(nèi)鏈接使用nofollow,在Google上可能是浪費(fèi)PR,在百度上是可以規(guī)劃站內(nèi)鏈接權(quán)重的流向的。

3.nofollow的使用方法

nofollow有兩種使用方法,一種是給鏈接添加nofollow屬性:

<a href="URL" rel="nofollow" >灌水</a><a href="URL" rel="external nofollow" >灌水</a>

第一個(gè)是通用的寫(xiě)法,意在告訴搜索引擎不要跟蹤此鏈接;第二個(gè)是更專業(yè)的寫(xiě)法,意在告訴搜索引擎這是一個(gè)外部鏈接,不要追蹤。

這兩種寫(xiě)法都是針對(duì)指定鏈接的,這樣可以避免給這些鏈接導(dǎo)出權(quán)重,把留下的權(quán)重導(dǎo)給頁(yè)面上其他鏈接。鏈接添加nofollow之后,當(dāng)搜索引擎第一次發(fā)現(xiàn)這個(gè)鏈接時(shí),還是會(huì)把它放入到待抓取URL隊(duì)列中,也是會(huì)被抓取的,但是搜索引擎會(huì)記錄當(dāng)前網(wǎng)頁(yè)對(duì)它的屬性說(shuō)明,當(dāng)前頁(yè)面并不會(huì)給這個(gè)鏈接導(dǎo)出權(quán)重。

另一種是nofollow還可以在meta標(biāo)簽中使用:

<meta name="robots" content="nofollow"><meta name="BaiduSpider" content="nofollow">

這兩種寫(xiě)法都是在告訴所有搜索引擎不要追蹤此網(wǎng)頁(yè)上的鏈接,并且不給頁(yè)面上的鏈接傳遞權(quán)重。不過(guò)第一個(gè)是針對(duì)所有搜索引擎有效,第二個(gè)只針對(duì)百度有效。也可以換成其他搜索引擎的Spider名稱,如果該搜索引擎支持這個(gè)標(biāo)簽,也會(huì)有相同的效果。如果頁(yè)面使用了這個(gè)標(biāo)簽,那么搜索引擎就不會(huì)發(fā)現(xiàn)和抓取該頁(yè)面上的鏈接了。

4.使用nofollow優(yōu)化內(nèi)鏈

首先可以使用nofollow的鏈接就是那些不競(jìng)爭(zhēng)排名的頁(yè)面的鏈接,比如注冊(cè)、登錄、投訴舉報(bào)等鏈接。這些鏈接沒(méi)有競(jìng)爭(zhēng)排名的作用,只是站內(nèi)的功能性頁(yè)面,可以對(duì)其在全站內(nèi)的鏈接都進(jìn)行nofollow處理。至于常說(shuō)的“聯(lián)系我們”要根據(jù)情況而定,有的網(wǎng)站有品牌,“***聯(lián)系方式”也有很高的搜索量,此時(shí)這個(gè)頁(yè)面可能就是有排名價(jià)值的,最好不要對(duì)其鏈接進(jìn)行nofollow。另外一個(gè)頁(yè)面中對(duì)另外一個(gè)頁(yè)面的導(dǎo)出鏈接只有一個(gè)就好,如考慮出現(xiàn)多次,可以在其第二次出現(xiàn)時(shí)就開(kāi)始使用nofollow標(biāo)簽。

除以上不競(jìng)爭(zhēng)排名的頁(yè)面外,對(duì)于競(jìng)爭(zhēng)排名的網(wǎng)頁(yè)也可以使用nofollow來(lái)控制站內(nèi)權(quán)重的導(dǎo)向。如圖5-22所示為途牛網(wǎng)首頁(yè)對(duì)站內(nèi)鏈接使用nofollow的情況,虛線框起來(lái)的鏈接都是nofollow的鏈接。途牛網(wǎng)把首頁(yè)的權(quán)重導(dǎo)向了旅游目的地,地區(qū)攻略等競(jìng)爭(zhēng)排名的頁(yè)面,把旅游團(tuán)信息的鏈接全部nofollow掉了,可能是考慮到幾乎很少有人針對(duì)旅游團(tuán)進(jìn)行搜索。有的朋友可能比較納悶,既然不給這些內(nèi)容權(quán)重,直接使用前面介紹的JS或框架調(diào)用不可以嗎?還可以縮減網(wǎng)頁(yè)體積。要注意的是,途牛網(wǎng)只是首頁(yè)不給這些旅游團(tuán)信息導(dǎo)權(quán)重而已,使用nofollow后,百度還是可以發(fā)現(xiàn)和抓取這樣鏈接指向的頁(yè)面的,如果內(nèi)容不錯(cuò),還是會(huì)進(jìn)行索引的。

圖5-22 途牛網(wǎng)首頁(yè)

途牛網(wǎng)的考慮應(yīng)該是把首頁(yè)的權(quán)重盡可能地導(dǎo)向重要競(jìng)爭(zhēng)排名的頁(yè)面,不給旅游團(tuán)信息導(dǎo)權(quán)重,但是這些信息還是需要被百度收錄的,并且這些旅游團(tuán)信息還可以豐富網(wǎng)站首頁(yè)的內(nèi)容,并不像文章頁(yè)周?chē)?span style="font-size: 12px;">的噪聲鏈接,所以就直接在鏈接上使用了nofollow,并沒(méi)有采用JS或框架的調(diào)用方式。在此需要提醒的是,鏈接即使使用了nofollow,搜索引擎也會(huì)進(jìn)行抓取和收錄,這個(gè)標(biāo)簽只是建議搜索引擎當(dāng)前頁(yè)面不給此鏈接頁(yè)面?zhèn)鬟f權(quán)重而已,并不能禁止搜索引擎的抓取和收錄。同時(shí)nofollow關(guān)于權(quán)重方面也只是“建議”而已,搜索引擎不一定會(huì)完全遵守站長(zhǎng)的設(shè)置,而是有一套比較完善的判斷各種鏈接是否有意義的算法,具體鏈接是否還導(dǎo)權(quán)重,會(huì)根據(jù)這個(gè)鏈接是否具有推薦意義來(lái)計(jì)算。搜索引擎會(huì)參考鏈接是否有nofollow,但不會(huì)只是參考鏈接是否加有nofollow標(biāo)簽來(lái)決定這個(gè)鏈接是否會(huì)導(dǎo)出權(quán)重。搜索引擎不會(huì)把鏈接是否導(dǎo)出權(quán)重的權(quán)限完全交給站長(zhǎng),否則會(huì)出現(xiàn)混亂局面。

接上文nofollow的使用。不僅在網(wǎng)站首頁(yè),在網(wǎng)站的任何頁(yè)面都可以這樣來(lái)操作,nofollow可以輔助站長(zhǎng)和SEO人員更好地引導(dǎo)站內(nèi)權(quán)重的流向,這樣就可以使得站長(zhǎng)和SEO人員更好地優(yōu)化網(wǎng)站的內(nèi)鏈結(jié)構(gòu)?,F(xiàn)在很多大型網(wǎng)站都使用nofollow了,百度經(jīng)驗(yàn)內(nèi)容頁(yè)導(dǎo)出的站外鏈接,以及百度知道頂部導(dǎo)航中對(duì)其他百度產(chǎn)品的鏈接都使用了

nofollow(如圖5-23所示)。所以站長(zhǎng)和SEO們也應(yīng)該重視這個(gè)標(biāo)簽。

圖5-23 百度知道導(dǎo)航


5.1.10 Canonical標(biāo)簽的使用及問(wèn)題

大家如有留意,在百度搜索中搜索某些關(guān)鍵詞,經(jīng)常會(huì)出現(xiàn)網(wǎng)站列表或文章分頁(yè)的非第一頁(yè)出現(xiàn)在搜索結(jié)果中,第一頁(yè)卻無(wú)

圖5-24 第二頁(yè)作為主要頁(yè)面參與了排名

影無(wú)蹤的情況。如圖5-24所示,百度搜索“型男街拍 大男人小點(diǎn)綴”,文章的第二頁(yè)被當(dāng)成主要頁(yè)面參與了排名。相信普通搜索用戶對(duì)此也會(huì)不滿,常常需要點(diǎn)擊搜索結(jié)果后,再點(diǎn)擊分頁(yè)中的第一頁(yè)才開(kāi)始瀏覽。百度官方對(duì)此也存在疑惑,加上大量站長(zhǎng)長(zhǎng)期的反映和訴求,百度終于于2013年年初開(kāi)始支持Canonical標(biāo)簽,通過(guò)站長(zhǎng)和搜索引擎合作的方式來(lái)解決這個(gè)問(wèn)題。

百度對(duì)Canonical的介紹為:

對(duì)一組內(nèi)容完全相同或高度相似的網(wǎng)頁(yè),通過(guò)使用Canonical標(biāo)簽可以告訴搜索引擎哪個(gè)頁(yè)面為規(guī)范的網(wǎng)頁(yè),能夠規(guī)范網(wǎng)址并避免搜索結(jié)果中出現(xiàn)多個(gè)內(nèi)容相同或相似的頁(yè)面,幫助解決重復(fù)內(nèi)容的收錄問(wèn)題,避免網(wǎng)站相同內(nèi)容網(wǎng)頁(yè)的重復(fù)展示及權(quán)重的分散,提升規(guī)范網(wǎng)頁(yè)的權(quán)重,優(yōu)化規(guī)范網(wǎng)頁(yè)的排名。

規(guī)范頁(yè)也就是一組內(nèi)容完全相同或高度相似網(wǎng)頁(yè)的首選版本。

Canonical標(biāo)簽的使用方式為:在非規(guī)范網(wǎng)頁(yè)的<head>部分創(chuàng)建link元素,形式為<link rel="Canonical" href="規(guī)范頁(yè)URL">。添加此鏈接和屬性可以告訴百度:“在內(nèi)容相同或高度相似的所有網(wǎng)頁(yè)中,該網(wǎng)頁(yè)為最規(guī)范最有價(jià)值的頁(yè)面,推薦將該網(wǎng)頁(yè)排在搜索結(jié)果中靠前的位置。”也就是說(shuō)在搜索相關(guān)關(guān)鍵詞時(shí),規(guī)范頁(yè)會(huì)被當(dāng)做主要頁(yè)面參與排名,而減少上例中的情況。

常見(jiàn)的需要使用Canonical標(biāo)簽的情況如下。

(1)由于篇幅顯示問(wèn)題,對(duì)文章進(jìn)行了分頁(yè)顯示,如果各分頁(yè)的Title完全相同或只是用“第N頁(yè)”區(qū)分,為了避免上例中的問(wèn)題,就可以對(duì)第一頁(yè)之外的分頁(yè)使用Canonical標(biāo)簽。當(dāng)然如果有能力,推薦對(duì)文章分頁(yè)使用前面所提過(guò)的形式:篇幅過(guò)長(zhǎng)的文章,以小標(biāo)題為界進(jìn)行分頁(yè),每個(gè)分頁(yè)都有自己優(yōu)化的主關(guān)鍵詞,首頁(yè)優(yōu)化核心關(guān)鍵詞,這樣就沒(méi)有必要使用Canonical了。

(2)由于網(wǎng)站功能性設(shè)置問(wèn)題,對(duì)同一個(gè)頁(yè)面產(chǎn)生了不同的

URL,并且因?yàn)楣δ茉O(shè)置問(wèn)題,以至于不能直接使用301來(lái)解決這個(gè)問(wèn)題。例如在前面URL優(yōu)化注意事項(xiàng)中所提到的,千品網(wǎng)為站內(nèi)主要鏈接添加了追蹤用戶行為參數(shù)的內(nèi)容。

(3)同一內(nèi)容列表中,按照價(jià)格、時(shí)間、信用、人氣、銷(xiāo)量等進(jìn)行排序后出現(xiàn)頁(yè)面內(nèi)容和默認(rèn)排序高度相似的情況,比如商城的商品列表頁(yè)面和租房的房源列表頁(yè)面。如果非默認(rèn)條件的排序也都產(chǎn)生了不同的URL,并且也都允許搜索引擎的抓取和收錄,那么就有必要對(duì)非默認(rèn)排序的列表使用Canonical標(biāo)簽。當(dāng)然站長(zhǎng)和SEO人員也可以根據(jù)情況對(duì)不同排序條件的列表頁(yè)優(yōu)化不同的關(guān)鍵詞,比如按價(jià)格排序就可以優(yōu)化“最貴的**”“價(jià)格最高的**”“報(bào)價(jià)最高的**”“最便宜的**”“價(jià)格最低的**”“性價(jià)比最好的**”等關(guān)鍵詞,不過(guò)這時(shí)要做好設(shè)計(jì),要使不同排序后的列表內(nèi)容沒(méi)有大面積的重復(fù),從而使這些列表頁(yè)可以獲得更多的搜索流量,并且也沒(méi)有必要再使用

Canonical標(biāo)簽。

(4)商城類(lèi)網(wǎng)站,同一個(gè)商品有多個(gè)歷史版本介紹的情況下,可以對(duì)商品的歷史版本頁(yè)面使用Canonical標(biāo)簽。

(5)在網(wǎng)站改版或換域名后,由于各種原因不能設(shè)置301重定向時(shí),可以使用Canonical標(biāo)簽來(lái)標(biāo)注新版頁(yè)面URL等。

總之當(dāng)一組頁(yè)面內(nèi)容幾乎完全相同且有某種邏輯關(guān)系時(shí)才有必要使用Canonical標(biāo)簽?,F(xiàn)在網(wǎng)絡(luò)上有一些文章推薦對(duì)目錄、列表和欄目使用Canonical標(biāo)簽是不太恰當(dāng)?shù)模拇_有不少列表分頁(yè)代替首頁(yè)參與了排名,雖然對(duì)目錄、列表和欄目分頁(yè)使用Canonical并沒(méi)有大的副作用,但是Canonical并不是用來(lái)解決這個(gè)問(wèn)題的,據(jù)說(shuō)日后百度會(huì)推出專門(mén)的分頁(yè)標(biāo)識(shí)標(biāo)簽,這個(gè)分頁(yè)標(biāo)簽應(yīng)該會(huì)解決這個(gè)問(wèn)題,

Canonical更多地是用于重復(fù)內(nèi)容頁(yè)。

在Canonical標(biāo)簽中可以使用相對(duì)鏈接,也可以使用絕對(duì)鏈接。

安全起見(jiàn),建議使用絕對(duì)鏈接,避免出現(xiàn)未知錯(cuò)誤。需要注意的是,雖然在網(wǎng)站改版和換域名時(shí),如果不能配置301重定向,可以使用

Canonical標(biāo)簽標(biāo)注新版頁(yè)面URL,但這只是不能配置重定向情況下的無(wú)奈之舉,并不能使用Canonical標(biāo)簽來(lái)代替301重定向權(quán)重迭加的作用。雖然百度在介紹Canonical時(shí)提到“提升規(guī)范網(wǎng)頁(yè)的權(quán)重,優(yōu)化規(guī)范網(wǎng)頁(yè)的排名”,但Canonical標(biāo)簽其實(shí)只是告訴搜索引擎哪個(gè)版本的URL是主顯版本,并不是一定把非規(guī)范頁(yè)的權(quán)重迭加到規(guī)范頁(yè)上了。

另外,百度官方已經(jīng)說(shuō)明百度不一定會(huì)完全遵守

rel="Canonical"標(biāo)簽,百度會(huì)根據(jù)站長(zhǎng)的推薦及自己系統(tǒng)的算法來(lái)綜

合選擇。站長(zhǎng)和SEO人員往往會(huì)挖掘出標(biāo)簽本身作用之外的用途,可能百度為了避免因?yàn)橹С中聵?biāo)簽而增加相應(yīng)的算法漏洞,所以對(duì)

Canonical標(biāo)簽進(jìn)行了相對(duì)保守的支持。

5.1.11 404和503

404和503都是服務(wù)器狀態(tài)碼。404表示訪問(wèn)的網(wǎng)頁(yè)未找到;503表示服務(wù)器臨時(shí)有問(wèn)題。

網(wǎng)站有沒(méi)有設(shè)計(jì)404友好頁(yè)面往往是SEO人員診斷網(wǎng)站SEO水平的一個(gè)標(biāo)準(zhǔn)。如果網(wǎng)站中存在大量死鏈接,當(dāng)用戶和Spider訪問(wèn)時(shí)返回404錯(cuò)誤,次數(shù)過(guò)多后就會(huì)降低用戶和Spider對(duì)網(wǎng)站的整體印象,很有可能以后就會(huì)減少來(lái)訪或者不再來(lái)訪。值得一提的是,如果網(wǎng)站之前沒(méi)有404錯(cuò)誤,因?yàn)槟撤N原因突然有部分頁(yè)面返回404了,此時(shí)Spider會(huì)頻繁地對(duì)其進(jìn)行抓取,以確定這些頁(yè)面是真正被刪除,還是網(wǎng)站臨時(shí)出了問(wèn)題。

網(wǎng)站出現(xiàn)404錯(cuò)誤,會(huì)被搜索引擎視為比較嚴(yán)重降低用戶體驗(yàn)的行為。在搜索排名中的網(wǎng)頁(yè)如果出現(xiàn)404錯(cuò)誤,往往會(huì)受到搜索引擎的及時(shí)處理,以減少對(duì)搜索用戶的用戶體驗(yàn)傷害。那么作為站長(zhǎng)或SEO人員,當(dāng)然要盡力減少網(wǎng)站出現(xiàn)404的情況。如果是網(wǎng)站程序或服務(wù)器出現(xiàn)臨時(shí)錯(cuò)誤,千萬(wàn)不要讓服務(wù)器返回404狀態(tài),在一段時(shí)間內(nèi)有大量頁(yè)面404錯(cuò)誤,搜索引擎可能會(huì)刪掉這些網(wǎng)頁(yè)的索引,并降低對(duì)網(wǎng)站的抓取頻率。對(duì)于程序或服務(wù)器錯(cuò)誤導(dǎo)致網(wǎng)站臨時(shí)不能訪問(wèn)的情況,要及時(shí)返回503狀態(tài)碼,告訴搜索引擎服務(wù)器臨時(shí)有問(wèn)題,過(guò)段時(shí)間再來(lái)抓取。

如果網(wǎng)站因?yàn)樘厥庠虮仨殑h除一批網(wǎng)頁(yè),那么就把這些網(wǎng)頁(yè)全部返回404,在整個(gè)網(wǎng)站范圍內(nèi)撤掉這些頁(yè)面的鏈接,并制作這些頁(yè)面URL的地圖文件,通過(guò)百度站長(zhǎng)平臺(tái)和Google Webmaster中的死鏈工具和“刪除網(wǎng)址”提交到百度和Google。百度和Google接收到站長(zhǎng)提交的死鏈信息后,就會(huì)停止對(duì)這些鏈接的抓取,否則突然出現(xiàn)大量404頁(yè)面,會(huì)讓Spider對(duì)其進(jìn)行頻繁抓取,這樣不僅消耗自己的帶寬,也會(huì)降低搜索引擎對(duì)網(wǎng)站的印象。

作為站長(zhǎng)和SEO人員,也要經(jīng)常分析網(wǎng)站日志,分析Spider的抓取狀態(tài),發(fā)現(xiàn)4**或5**開(kāi)頭的狀態(tài)碼都要引起足夠的重視,并詳細(xì)分析原因,及時(shí)處理。當(dāng)然也要為網(wǎng)站制作一個(gè)友好的404錯(cuò)誤頁(yè)面,引導(dǎo)用戶留在站內(nèi),盡量減少因?yàn)?04錯(cuò)誤而造成的用戶流失??梢愿鶕?jù)用戶refer推薦相關(guān)內(nèi)容的鏈接,也可以做一個(gè)比較友好的引導(dǎo)界面。
 



圖5-25 富營(yíng)銷(xiāo)論壇404頁(yè)面

如圖5-25所示為曾經(jīng)的富營(yíng)銷(xiāo)論壇的404錯(cuò)誤頁(yè)面的設(shè)計(jì),還算是比較友好的。

5.1.12 目錄、子域名的比較和選擇

在網(wǎng)站設(shè)計(jì)之初及網(wǎng)站運(yùn)營(yíng)過(guò)程中,添加豐富的新內(nèi)容時(shí)都會(huì)面臨使用目錄還是子域名的選擇。常見(jiàn)的SEO建議是,如果要開(kāi)的頻道內(nèi)容不夠豐富,就使用目錄的形式,如果新開(kāi)頻道內(nèi)容豐富,就可以使用子域名。

站在SEO效果的角度,在不考慮鏈接導(dǎo)入權(quán)重的情況下,一般同一個(gè)網(wǎng)站內(nèi)各類(lèi)頁(yè)面的權(quán)重大小關(guān)系為:

主域名首頁(yè)>子域名首頁(yè)>主域名目錄>子域名目錄>主域名內(nèi)頁(yè)>子域名內(nèi)頁(yè)

關(guān)系中的兩個(gè)“目錄”為同級(jí)目錄。這里主要看兩個(gè)關(guān)系,一個(gè)是子域名的權(quán)重大于主域名目錄的權(quán)重;一個(gè)是主域名內(nèi)頁(yè)大于子域名內(nèi)頁(yè)的權(quán)重。因此建議,如果你新開(kāi)的頻道只是競(jìng)爭(zhēng)頻道首頁(yè)的幾個(gè)關(guān)鍵詞排名,內(nèi)頁(yè)排名并不重要,那就使用子域名的形式,當(dāng)然子域名下也需要配備一些內(nèi)頁(yè),最好不要只是一個(gè)單頁(yè)面;如果你新開(kāi)頻道的內(nèi)容需要獲得比較好的排名,獲取比較多的長(zhǎng)尾流量,就可以使用頂級(jí)域名下目錄的形式。

使用子域名會(huì)使得頻道首頁(yè)的排名比較好做,使用目錄會(huì)使得頻道內(nèi)容頁(yè)的排名比較好做。曾經(jīng)有個(gè)網(wǎng)站的某個(gè)頻道使用的是子域名的形式,子域名首頁(yè)排名很好,但是內(nèi)容頁(yè)的排名很差。后來(lái)該網(wǎng)站把該子域名轉(zhuǎn)換成主域名的目錄后,頻道首頁(yè)的排名從第一名掉到百度搜索的第二、三頁(yè),但是內(nèi)容頁(yè)的整體排名有很大提升,流量翻了2~3倍。使用了目錄的形式后,可以把這個(gè)目錄首頁(yè)當(dāng)成一個(gè)網(wǎng)站權(quán)重較高的網(wǎng)站,排到前面的可能性就較大,反之則較小。通常情況下主站點(diǎn)的權(quán)重是最高的,子站點(diǎn)會(huì)從主站點(diǎn)繼承一部分權(quán)重,繼承的多少視子站點(diǎn)質(zhì)量而定。

在內(nèi)容沒(méi)有豐富到可以作為一個(gè)獨(dú)立站點(diǎn)之前,內(nèi)容放到主站點(diǎn)下一個(gè)目錄中能在搜索引擎中獲得更好的表現(xiàn)。

(2)內(nèi)容差異度較大、關(guān)聯(lián)度不高的內(nèi)容,使用子站點(diǎn)形式搜索引擎會(huì)識(shí)別站點(diǎn)的主題,如果站點(diǎn)中內(nèi)容關(guān)聯(lián)度不高,可能導(dǎo)致搜索引擎錯(cuò)誤的識(shí)別。關(guān)聯(lián)度不高的內(nèi)容,放在不同的子域名下,可以幫助搜索引擎更好地理解站點(diǎn)的主題。

(3)域名間內(nèi)容做好權(quán)限,互相分開(kāi),a. example.com下的內(nèi)容,不能通過(guò)b.example.com訪問(wèn)。

子域名間的內(nèi)容可以互相訪問(wèn),可能會(huì)被搜索引擎當(dāng)做重復(fù)內(nèi)容而進(jìn)行除重處理,保留的URL不一定是正常域名下的。

(4)不要濫用子域名,無(wú)豐富內(nèi)容而濫用大量子域名,會(huì)被搜索引擎當(dāng)做作弊行為而受到懲罰。

細(xì)細(xì)品味一下建議中第(1)條的“出身”,就可以側(cè)面地驗(yàn)證上述各類(lèi)頁(yè)面權(quán)重高低的關(guān)系。

如對(duì)本文有疑問(wèn),請(qǐng)?zhí)峤坏浇涣髡搲瑥V大熱心網(wǎng)友會(huì)為你解答??! 點(diǎn)擊進(jìn)入論壇

發(fā)表評(píng)論 (493人查看,0條評(píng)論)
請(qǐng)自覺(jué)遵守互聯(lián)網(wǎng)相關(guān)的政策法規(guī),嚴(yán)禁發(fā)布色情、暴力、反動(dòng)的言論。
昵稱:
最新評(píng)論
------分隔線----------------------------

其它欄目

· 建站教程
· 365學(xué)習(xí)

業(yè)務(wù)咨詢

· 技術(shù)支持
· 服務(wù)時(shí)間:9:00-18:00
365建站網(wǎng)二維碼

Powered by 365建站網(wǎng) RSS地圖 HTML地圖

copyright © 2013-2024 版權(quán)所有 鄂ICP備17013400號(hào)