当前位置:首页 > 网络科技 > 浅谈什么是蜘蛛黑洞及如何避免

浅谈什么是蜘蛛黑洞及如何避免

12个月前 (09-01)admin网络科技55

蜘蛛黑洞其实就是蜘蛛陷阱中最常见的一种,可能是由于网站程序细节上的处理不到位而形成,也有可能是黑帽 SEO 手段的故意为止,总之这就是对搜索引擎非常不友好,并且不利于网站的长期运营和 SEO 优化。

1.什么是蜘蛛黑洞?

百度官方早在几年前就对蜘蛛黑洞做过解释:对于百度搜索引擎来说,蜘蛛黑洞特指网站通过极低的成本制造出大量参数过多,及内容雷同但具体参数不同的动态 URL ,就像一个无限循环的“黑洞”将 spider 困住,Baiduspider 浪费了大量资源抓取的却是无效网页。

子凡所服务的一个公司就曾花钱找网络公司给做过所谓的“全网营销网站”,通过搜索引擎的 sitie 查看 Google 的收录可以达到上万的索引数据,而通过百度可以查到仅有 1 条首页结果,其中大量的重复页面均是由于动态 URL 链接造成,只要文章的 ID 一致,其它任意参数都会是一个一模一样的页面。

再比如很多网站都有筛选功能,通过筛选功能产生的网页经常会被搜索引擎大量抓取,而这其中很大一部分检索价值不高,如“500-1000 之间价格的租房”,首先网站(包括现实中)上基本没有相关资源,其次站内用户和搜索引擎用户都没有这种检索习惯。这种网页被搜索引擎大量抓取,只能是占用网站宝贵的抓取配额。

2.如何避免蜘蛛黑洞?

由于蜘蛛黑洞大多是由于动态 URL 链接造成,一方面是从网站技术上杜绝这样的情况,保证动态 URL 的唯一性,非规范的 URL 应该返回 404 状态或者跳转。

同样根据百度官方的推荐方式还可以巧用 robots 避免蜘蛛黑洞,robots.txt 的文件用法中有这样一条规则:Disallow: /*?* ,即禁止搜索引擎访问网站中所有的动态页面。该网站恰是通过这种方式,对 Baiduspider 优先展示高质量页面、屏蔽了低质量页面,为 Baiduspider 提供了更友好的网站结构,避免了黑洞的形成。

在网站的 robots.txt 文件中添加一行 Disallow: /*?*规则,主流的搜索引擎都是能够支持和遵守的,能够更有利于网站的优化与内容的运营。

w.haolusi.com

本文链接:https://w.haolusi.com/t/7847.html

扫描二维码推送至手机访问。

版权声明:本文由豪鲁斯兴趣网发布,如需转载请注明出处。

本文链接:https://w.haolusi.com/?id=2380

标签: SEO问答
分享给朋友:

“浅谈什么是蜘蛛黑洞及如何避免” 的相关文章

告别焦虑,技术人的“慢功夫”哲学

告别焦虑,技术人的“慢功夫”哲学

我们现在处一个快节奏的时代,每一个行业都在高速发展,我们也常常被告知要抓住每一个机会,快速成长,迅速成功。但对许多技术人来说,所谓的“快”,有时反而会让我们失去平衡,陷入焦虑和迷茫, 常常又进入事倍功半的困境。之前遇到过一位刚入行不久的年轻技术人,他一脸焦虑地问我:“如果我现在不快点提高,是不是以后...

最新免费可用!ChatGPT 4.0/4o/3.5 镜像 Mirror|免翻直链中文镜像(2024年8月更新)

最新免费可用!ChatGPT 4.0/4o/3.5 镜像 Mirror|免翻直链中文镜像(2024年8月更新)

本篇文章目录|Table of Contents Hide ChatGPT 4.0/4o/3.5 镜像站列表ChatGPT镜像更新历史什么是Cha...

最新可用!2024年最新Github镜像,更快部署下载(2024年08更新)

最新可用!2024年最新Github镜像,更快部署下载(2024年08更新)

本篇文章目录|Table of Contents Hide Github:伟大的共建社区01.GitHub 镜像可用站点02.GitHub-建设未...

MySQL如何选择utf8mb4_general_ci和utf8mb4_0900_ai_ci字符集排序规则

MySQL如何选择utf8mb4_general_ci和utf8mb4_0900_ai_ci字符集排序规则

最近在做一些关于新项目的规划和测试,那么既然是要做新的项目当然首先要考虑的就是最新的技术标准,也把开发环境都统一升级了一遍,而在做 MySQL 数据库创建的时候就发现了一个小小的变化,本着对技术的执着那么就不得不来一探究竟。正式生产环境本着稳定高于一切的宗旨,所以也就不太可能做到数据库方面的升级保持...

WordPress别名slug增加点(.)符号支持

WordPress别名slug增加点(.)符号支持

熟悉 WordPress 的朋友们都知道,WordPress 在 URL 链接中的处理算得上是一刀切,所有的特殊符号及字符都是使用减号/连字符(-)来进行分隔,这其实是一种对搜索引擎非常友好的分隔方式,也是谷歌搜索引擎所推荐的连字符,其中谷歌有一句提示“不妨考虑在网址中使用连字符来分隔字...

BOOM Library Discography|影视广播级实录拟音音效素材库|Sound FX Library|下载|Download

BOOM Library Discography|影视广播级实录拟音音效素材库|Sound FX Library|下载|Download

        本篇文章目录|Table of ContentsHideSound FX:什么是音效专业的高品质音效 – BOOM Library试听下载(百度云)精品资源整理(百度云)Boom Library 全集(125)资源整理|百度云|未压缩文件¥30...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。