当前位置:首页 > 网络科技 > 什么是蜘蛛陷阱及如何判断识别

什么是蜘蛛陷阱及如何判断识别

8个月前 (09-01)admin网络科技19

为了沉淀一些基础性的网站 SEO 优化知识,子凡最近也都尽可能的在泪雪博客分享日常中被网友问答以及曾经没有来得及分享的优化内容,前两天分享了《什么是蜘蛛黑洞及如何避免》,那么就继续来谈谈蜘蛛陷阱的问题。

1. 什么是蜘蛛陷阱?

蜘蛛陷阱与蜘蛛黑洞似乎是同一个概念,没有非常正规的说法,蜘蛛陷阱就是网站通过技术漏洞或者认为方式造成的一种策略,一旦搜索引擎开始抓取到站点某个 URL 后,就会通过该页面发现新链接从而诱使搜索引擎蜘蛛无限循环的抓取,也就造成了进去后就无法出来,有些神似站群的思维方式,这种情况就被称之为蜘蛛陷阱。

2. 哪些情况容易造成蜘蛛陷阱?

站内搜索

这是几乎所有站点都会存在的功能,由于其功能的特殊性,搜索关键词不确定,搜索时的 URL 也基本为动态情况,例如 WordPress 程序的站点默认搜索就是“https://w.haolusi.com/?s=关键词”的链接,而这样的动态链接就有无数的可能,如果不利用 robots.txt 文件进行屏蔽,那么搜索引擎是可能会收录这些搜索结果页面,这种原理也是被一些超级外链或者自动外链的工具所利用。

分页、feed

这种情况子凡认为最常见的就是出现在 WordPress 程序上面,文章的评论分页以及 feed,会给一篇文章内容造成重复的页面,虽然不至于直接造成蜘蛛陷阱,但是从网站优化的细节考虑,建议还是通过 robots.txt 禁止屏蔽,如果是评论分页也可以通过页面头部添加“rel=canonical”来规范指向文章 URL。

产品类网站

大多的电子商务网站平台以及产品类的网站都会存在的一个问题,例如一双鞋子有多个不同的尺码颜色等,但是其描述内容和展示都会是一样的,所以很多网站就会出现大量不同的 URL 而且几乎一样的页面,这样也非常容易造成蜘蛛陷阱,浪费搜索引擎资源,重复的页面也会破坏网站 SEO,同样可以通过 robots.txt 和页面头部添加“rel=canonical”来规范页面统一性。

3. 如何判断识别网站是否存在蜘蛛陷阱?

这里子凡认为有两种非常简单的方法就能够判断出网站当前是否存在蜘蛛陷阱的情况:

一、网站统计/网站日志,通过直接查看搜索引擎抓取的 URL 中是否存在大量不正常的 URL 地址;

二、网站抓取频率,几乎所有的搜索引擎站长平台都提供的抓取频率和抓取压力的反馈,如果抓取频率突然出现异常的高时,那么很有可能出现蜘蛛陷阱的情况了。

简单总结

蜘蛛陷阱这个问题说大不大说小不小,有人利用这些陷阱提升网站的收录和抓取,虽说不可取却也有可能在短时间内获得不错的收录和排名效果,当然这些可能都只是短时间的,如果网站确确实实存在这些问题,而你想要做好网站,那么记得及时处理。

w.haolusi.com

本文链接:https://w.haolusi.com/t/7849.html

扫描二维码推送至手机访问。

版权声明:本文由豪鲁斯兴趣网发布,如需转载请注明出处。

本文链接:https://w.haolusi.com/?id=2377

标签: SEO问答
分享给朋友:

“什么是蜘蛛陷阱及如何判断识别” 的相关文章

WordPress标签实现追加自定义链接

WordPress标签实现追加自定义链接

WordPress 标签的用处说多不多,说少不少,其中利用 WordPress 标签做聚合页面优化是一种搜索引擎很喜欢的方式,或者说很多搜索引擎相比正文页面而言更喜欢抓取和收录标签页面,其次对于 WordPress 标签的作用就是用于文章关键词调用以及文章内链。那么今天子凡我我将利用几行代码来实现给...

MYSQL字符集有哪些

MYSQL字符集有哪些

MySQL 中的字符集是用来确定数据库中字符数据的编码方式,它决定了如何存储和检索数据。MySQL 中常用的字符集:UTF8:UTF-8 是一种 Unicode 字符编码方式,它可以表示世界上大部分的文字字符。MySQL 中的 UTF8 字符集最多只能存储 3 字节的 UTF-8 编码字符,...

最新免费可用!ChatGPT 4.0/4o/3.5 镜像 Mirror|免翻直链中文镜像(2024年8月更新)

最新免费可用!ChatGPT 4.0/4o/3.5 镜像 Mirror|免翻直链中文镜像(2024年8月更新)

本篇文章目录|Table of Contents Hide ChatGPT 4.0/4o/3.5 镜像站列表ChatGPT镜像更新历史什么是Cha...

MySQL如何选择utf8mb4_general_ci和utf8mb4_0900_ai_ci字符集排序规则

MySQL如何选择utf8mb4_general_ci和utf8mb4_0900_ai_ci字符集排序规则

最近在做一些关于新项目的规划和测试,那么既然是要做新的项目当然首先要考虑的就是最新的技术标准,也把开发环境都统一升级了一遍,而在做 MySQL 数据库创建的时候就发现了一个小小的变化,本着对技术的执着那么就不得不来一探究竟。正式生产环境本着稳定高于一切的宗旨,所以也就不太可能做到数据库方面的升级保持...

WordPress别名slug增加点(.)符号支持

WordPress别名slug增加点(.)符号支持

熟悉 WordPress 的朋友们都知道,WordPress 在 URL 链接中的处理算得上是一刀切,所有的特殊符号及字符都是使用减号/连字符(-)来进行分隔,这其实是一种对搜索引擎非常友好的分隔方式,也是谷歌搜索引擎所推荐的连字符,其中谷歌有一句提示“不妨考虑在网址中使用连字符来分隔字...

百度搜索资源平台恢复低质量网站添加管理

百度搜索资源平台恢复低质量网站添加管理

前些天看到新闻消息称百度 10 年老将赵世奇已离开华为回流百度,并且将负责 AI 技术在百度搜索业务方面的产品创新。而今天子凡我通过百度搜索资源平台抱着试一试的态度去添加我们的 TearSnow 泪雪官网,出乎意料的居然能够通过验证并且成功添加上,不会提示“该站点为低质站点,暂不可添加,...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。