作為一名SEOer大家肯定是知道搜索蜘蛛的,但是關于robots.txt這個搜索蜘蛛遵循協(xié)議,卻鮮少有人談起,其實用好robots是很容易為你網(wǎng)站提權的。
第一,用robots屏蔽網(wǎng)站重復頁
很多網(wǎng)站一個內(nèi)容提供多種瀏覽版本,雖然很方便用戶卻對蜘蛛造成了困難,因為它分不清那個是主,那個是次,一旦讓它認為你在惡意重復,兄弟你就慘了
User-agent: *
Disallow: /sitemap/ 《禁止蜘蛛抓取 文本網(wǎng)頁》
第二,用robots保護網(wǎng)站安全
很多人納悶了,robots怎么還和網(wǎng)站安全有關系了?其實關系還很大,不少低級黑客就是通過搜索默認后臺登陸,以達到入侵網(wǎng)站的目標
User-agent: *
Disallow: /admin/ 《禁止蜘蛛抓取admin目錄下所有文件》
第三,防止盜鏈
一般盜鏈也就幾個人,可是一旦被搜索引擎“盜鏈”那家伙你100M寬帶也吃不消,如果你做的不是圖片網(wǎng)站,又不想被搜索引擎“盜鏈”你的網(wǎng)站圖片
User-agent: *
Disallow: .jpg$
第四,提交網(wǎng)站地圖
現(xiàn)在做優(yōu)化的都知道做網(wǎng)站地圖了,可是卻沒幾個會提交的,絕大多數(shù)人是干脆在網(wǎng)頁上加個鏈接,其實robots是支持這個功能的
Sitemap: http://www.010wangzhanyouhua.com/sitemaps/sitemaps_1.xml
第五,禁止某二級域名的抓取
一些網(wǎng)站會對VIP會員提供一些特殊服務,卻又不想這個服務被搜索引擎檢索到
User-agent: *
Disallow: /