如何削减无效URL的匍匐战索引
后生可畏的云朝守视同窗(题中话:后生可畏是功德哈。我20多岁时人家道我像40岁,我40多岁时很多多少人道我像30多,汉子20到50岁能够做到根本一个模样)揭了个帖子:透过京东商乡看海内一线B2C网站网站优化通病。倡议先看谁人帖子再返来看本帖,否则没有简单大白上面正在道甚么。
简朴道,帖子指出一个严峻并且理想的SEO成绩:许多网站,特别是B2C,产物前提过滤体系(如挑选产物的品牌、价钱、尺寸、机能、参数等)会发生年夜量无效URL,之以是称为无效只是从SEO角度看的,那些URL其实不能发生SEO做用,反倒有背里做用,以是那些URL没有支录为好,本果包罗:
1.年夜量过滤前提页里内容反复或极其相似(年夜量复造内容将使网站团体量量降落)
2.年夜量过滤前提页里出有对应产物,页里无内容(如挑选“100元以下42寸LED电视”之类的)
3.绝年夜部门过滤前提页里出有排名才能(排名才能比分类页里低很多)却华侈必然权重
4.那些过滤前提页里也没有是产物页里支录的须要通讲(产物页里该当有别的内链协助匍匐战支录)
5.匍匐年夜量过滤前提页里极年夜华侈蜘蛛匍匐工夫,形成有效页里支录时机降落(过滤前提页里组开起去是巨量的)
那么如何只管使那些URL没有被匍匐战索引、支录呢?头几天的一篇帖子怎样躲藏内容也能够成为SEO成绩会商的是相似成绩,那种过滤页里便是念躲藏的内容品种之一。不外惋惜,我今朝念没有出完善的处理办法。云朝守视提出两个办法,我以为皆没法完善处理。
一是将没有念支录的URL连结为静态URL,以至成心越静态越好,以阻遏被匍匐战支录。可是,搜索系统如今皆能匍匐、支录静态URL,并且手艺上愈来愈没有是成绩。固然参数多到必然水平的确倒霉于支录,但4、5个参数凡是借能够支录。我们没法确认需求几参数才气阻遏支录,以是不克不及看成一个牢靠的办法。并且那些URL领受内链,又出有甚么排名才能,借是会华侈必然权重。
第两个办法,robots制止支录。一样,URL领受了内链也便领受了权重,robots文件制止匍匐那些URL,以是领受的权重不克不及通报进来(搜索系统没有匍匐便没有晓得有甚么导出链接),页里成为权重只进没有出的乌洞。
连背那些URL的链接共同nofollow也没有完善,战robots制止相似,nofollow正在Google的结果是那些URL出有领受权重,权重却也出有被分派到别的链接上,以是权重一样华侈了。百度据称撑持nofollow,但权重怎样处置已知。
将那些URL链接放正在Flash、JS里也出有效,搜索系统曾经能够匍匐Flash、JS里的链接,并且估量当前愈来愈善于爬。许多SEO疏忽了的一面是,JS中的链接不只能被爬,也能通报权重,战一般毗连一样。
也能够将过滤前提链接做成AJAX情势,用户面击后没有会会见一个新的URL,借是正在本来URL上,URL前面减了#,没有会被当做差别URL。战JS成绩一样,搜索系统正正在主动测验考试匍匐、抓与AJAX里的内容,那个办法也没有保险。
借一个办法是正在页里head部门减noindex+follow标签,意即本页里没有要索引,但跟踪页里上的链接。那样能够处理复造内容成绩,也处理了权重乌洞成绩(权重是能够跟着导出链接传到别的页里的),不克不及处理的是华侈蜘蛛匍匐工夫成绩,那些页里借是要被蜘蛛匍匐抓与的(然后才气看到页里html里的noindex+follow标签),对某些网站去道,过滤页里数目宏大,匍匐了那些页里,蜘蛛便出充足工夫爬有效页里了。
再一个能够思索的办法是躲藏页里(cloaking),也便是用法式检测会见者,是搜索系统蜘蛛的话返回的页里拿失落那些过滤前提链接,是用户的话才返回一般的有过滤前提的页里。那是一个比力幻想的处理办法,独一的成绩是,能够被看成做弊。搜索系统常跟SEO讲的判定能否做弊的最下本则是:假如出有搜索系统,您会没有会那么做?大概道,某种办法能否只是为了搜索系统而接纳?隐然,用cloaking躲藏没有念被匍匐的URL是为搜索系统做的,没有是为用户做的。固然那种状况下的cloaking目标是美妙的,出有歹意的,但风险是存正在的,胆小的可试用。
借一个办法是利用canonical标签,最年夜成绩是百度能否撑持已知,并且canonical标签是对搜索系统的倡议,没有是指令,也便是道那个标签搜索系统能够没有服从,即是出用。别的,canonical标签的本意是指定例范化网址,过滤前提页里能否合用有些存疑,究竟结果,那些页里上的内容常常是差别的。
今朝比力好的办法之一是iframe+robots制止。将过滤部门代码放进iframe,即是挪用别的文件内容,对搜索系统去道,那部门内容没有属于当前页里,也即躲藏了内容。但没有属于当前页里没有即是没有存正在,搜索系统是能够发明iframe中的内容战链接的,借是能够匍匐那些URL,以是减robots制止匍匐。iframe中的内容借是会有一些权重流得,但果为iframe里的链接没有是从当前页里分流权重,而只是从挪用的谁人文件分流,以是权重流得是比力少的。除排版、阅读器兼容性之类的头痛成绩,iframe办法的一个潜伏成绩是被以为做弊的风险。如今搜索系统普通没有以为iframe是做弊,许多告白便是放正在iframe中,但躲藏一堆链接战躲藏告白有些奇妙的区分。回到搜索系统判定做弊的总本则上,很易道那没有是专门为搜索系统做的。记得Matt Cutts道过,Google当前能够改动处置iframe的方法,他们借是期望正在统一个页里上看到一般用户能看到的一切内容。
总之,对那个理想、严峻的成绩,我今朝出有本人以为完善的谜底。固然,不克不及完善处理没有是便不克不及活了,差别网站SEO重面差别,详细成绩详细阐发,接纳上述办法中的一种或几种该当能够处理次要成绩。
而最最最年夜的成绩借没有是上述那些,而是偶然候您念让那些过滤页里被匍匐战支录,那才是杯具的开端。当前再会商。
做者:Zac@SEO天天一揭
版权一切。转载时必需以链接情势说明做者战本初出处及本声明。
注:相干网站建立本领浏览请移步到建站教程频讲。
相关信息
|
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
|
|