蜘蛛陷阱是什么,網(wǎng)站SEO如何避免蜘蛛陷阱
今天給大家說的蜘蛛陷阱。
我們看看百度百科對(duì)蜘蛛陷阱的定義:“蜘蛛陷阱”是阻止蜘蛛程序爬行網(wǎng)站的障礙物,通常是那些顯示網(wǎng)頁的技術(shù)方
法,很多瀏覽器在設(shè)計(jì)的時(shí)候考慮過這些因素,所以可能網(wǎng)頁界面看起來非常正常,但這些蜘蛛陷阱會(huì)對(duì)蜘蛛程序造成
障礙,如果消除這些蜘蛛陷阱,可以使蜘蛛程序收錄更多的網(wǎng)頁。
設(shè)想一下如果你去一個(gè)地方用百度地圖導(dǎo)航,結(jié)果地圖把你帶入一條荒無人煙的臭水溝里,你會(huì)怎么想。其實(shí)搜索引擎
蜘蛛和人一樣,如果讓蜘蛛掉進(jìn)了你設(shè)置的陷阱里,那么:蜘蛛很生氣,后果很嚴(yán)重了!
一旦把蜘蛛惹急了,不是對(duì)你的網(wǎng)站進(jìn)行降權(quán)就是K站,所以說蜘蛛大哥也不是好惹的。我們做SEO的還要心存敬畏之心
。
那么哪些是蜘蛛陷阱,如何預(yù)防?
1、各種跳轉(zhuǎn)
常見的網(wǎng)站跳轉(zhuǎn)方法例如:JS跳轉(zhuǎn)、Flash跳轉(zhuǎn)、302跳轉(zhuǎn)等,除301跳轉(zhuǎn)除外,因?yàn)樗撬阉饕嫱扑]和認(rèn)可的跳轉(zhuǎn)形式,它主要用在網(wǎng)站域名更改,利用301跳轉(zhuǎn)將老域名的權(quán)重全部繼承給新域名。除了301轉(zhuǎn)向很多的占用其他轉(zhuǎn)向欺騙用戶和搜索引擎,也是heimao的一種手段,所以建議大家不要使用,以免網(wǎng)站被K。除301之外的各種跳轉(zhuǎn)對(duì)搜索引擎來說都是不利的,不利于蜘蛛的爬取,給蜘蛛制造了所謂的陷阱。
2、復(fù)雜的框架結(jié)構(gòu)
框架結(jié)構(gòu)就目前來說算的上是網(wǎng)站建設(shè)界的老話題了,現(xiàn)如今建站愈來愈簡(jiǎn)單智能的時(shí)代,框架結(jié)構(gòu)逐漸落伍并且非常不利于蜘蛛爬取網(wǎng)站的內(nèi)容,所以框架結(jié)構(gòu)是被逼成了蜘蛛陷阱,老實(shí)講這不能怪它,可是也不得不怪它,這同時(shí)也驗(yàn)證了一句話:落后就要挨打。
3、動(dòng)態(tài)URL
我們知道,搜索引擎比較喜歡靜態(tài)網(wǎng)址,所以很多的動(dòng)態(tài)網(wǎng)站都會(huì)使用偽靜態(tài)設(shè)置。動(dòng)態(tài)URL通俗的解釋就是網(wǎng)站鏈接中帶有各種參數(shù)、等號(hào)、問號(hào)或者其它符號(hào)而長度還很長的鏈接,恰巧的是蜘蛛也喜歡這種鏈接,其實(shí)最根本的原因還是動(dòng)態(tài)URL不利于蜘蛛的爬取。
4、JS腳本
對(duì)于這一點(diǎn)可能存在一定的爭(zhēng)議。JS在網(wǎng)站建設(shè)中又離不開
,因?yàn)樗転榫W(wǎng)站實(shí)現(xiàn)很多功能和特效,但是它不利于蜘蛛爬取內(nèi)容,不過它也可以用在網(wǎng)站的其他方面對(duì)咱們做SEO的還是有所幫助的,比如為了避免網(wǎng)站權(quán)重的分散,我們就可以用JS腳本阻止蜘蛛對(duì)該頁面的抓取,而就這一點(diǎn)來說它又是網(wǎng)站SEO的好工具,所以對(duì)于JS腳本這一點(diǎn)還是自己掌握分寸吧!
5、頁面是frame框架結(jié)構(gòu)
網(wǎng)站使用的frame框架結(jié)構(gòu),這種結(jié)構(gòu)雖然代碼精簡(jiǎn),而且很方便更新維護(hù)網(wǎng)站,但是,這種結(jié)構(gòu)蜘蛛基本上抓不到這里面的內(nèi)容,特別是里面有那些重要內(nèi)容的時(shí)候,那更是對(duì)優(yōu)化很不利的。
6、必須要登陸才能訪問
有些企業(yè)站和個(gè)人站的設(shè)置一定要注冊(cè)登錄后才能看到相關(guān)的文章內(nèi)容。這是絕對(duì)不可取的,這相當(dāng)于把蜘蛛關(guān)在大門外了,畢竟搜索引擎蜘蛛不是人,沒有那么智能,他不會(huì)自動(dòng)填寫用戶名、密碼、驗(yàn)證碼,這種情況的頁面設(shè)置要特別是注意。嚴(yán)重的時(shí)候,蜘蛛不會(huì)光顧你的網(wǎng)站。
7、robots.txt書寫錯(cuò)誤
robots文件是蜘蛛訪問網(wǎng)站的第一個(gè)文件,這個(gè)文件告訴蜘蛛那些是可以抓取的,那些是不能抓的,robots文件編寫會(huì)有一定的格式要求,如果編寫錯(cuò)誤,也會(huì)禁止蜘蛛訪問和抓取。
8、Flash
Flash基本上被淘汰了,但有的網(wǎng)站頁面使用Flash視覺效果是很正常的,比如用Flash做的Logo、廣告、圖表等,這些對(duì)搜索引擎抓取和收錄是沒有問題的,很多網(wǎng)站的首頁是一個(gè)大的Flash文件,這種就叫蜘蛛陷阱,我們知道蜘蛛喜歡的是文字,雖然大的Flash效果看上去很漂亮,但搜索引擎無法讀取任何內(nèi)容,所以不提倡這種Flash做首頁圖片。
9、url層級(jí)太深
有的網(wǎng)頁沒有入口,而且距離網(wǎng)站的首頁又很遠(yuǎn),這種頁面就相對(duì)較難被蜘蛛爬行到,嚴(yán)格意義上來說這不屬于陷阱,但我們拿來說一下吧,畢竟也影響蜘蛛的抓取。內(nèi)頁和首頁的點(diǎn)擊距離越近,越容易得到更多的首頁權(quán)重傳遞。良好的網(wǎng)站結(jié)構(gòu)可以讓網(wǎng)站更多的頁面被收錄。
10、強(qiáng)制使用cookies,
對(duì)于搜索引擎來說是相當(dāng)于直接禁用了cookies的,而有些網(wǎng)站為了實(shí)現(xiàn)某些功能會(huì)采取強(qiáng)制cookies,比如說跟蹤用戶訪問路徑,記住用戶信息,甚至是盜取用戶隱私等,如果用戶在訪問這類站點(diǎn)時(shí)沒有啟用cookies,所顯示的頁面就會(huì)不正常,所以對(duì)于蜘蛛來講同樣的網(wǎng)頁無法正常訪問。
和各種各樣的作弊手法,比如說隱藏文字,隱藏鏈接等,采用偽裝網(wǎng)頁在判斷來訪者是蜘蛛還
是普通瀏覽器者而顯示不同的網(wǎng)頁,使用默認(rèn)錯(cuò)誤的404頁面等,同樣會(huì)給蜘蛛帶來爬行障礙。
綜上所述,是小編對(duì)蜘蛛陷阱的總結(jié),可能不僅全面,之后隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,還會(huì)出現(xiàn)其他的蜘蛛陷阱,對(duì)于站長來說蜘蛛就是我們的朋友,要善待它,他會(huì)給我們好的回報(bào),如果我們虐待他,那么我們的網(wǎng)站優(yōu)化之路就注定坎坷。
防范蜘蛛陷阱是網(wǎng)絡(luò)優(yōu)化之必要條件。
聲明:免責(zé)聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn)自行上傳,本網(wǎng)站不擁有所有權(quán),也不承認(rèn)相關(guān)法律責(zé)任。如果您發(fā)現(xiàn)本社區(qū)中有涉嫌抄襲的內(nèi)容,請(qǐng)發(fā)
送郵件至:operations@xinnet.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),本站將立刻刪除涉嫌侵權(quán)內(nèi)容。本站原創(chuàng)內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)
需注明出處:新網(wǎng)idc知識(shí)百科