404错误代码与软404错误:SEO优化的头阵
这篇文章将解释HTTP状态码中的404错误和软404错误之间的区别,以及解决方法。
Web浏览器中加载的每个页面都有一个包含在HTTP标头中的响应代码,该响应代码可能在网页本身上可见,也可能看不到。
服务器提供许多不同的响应代码来传达页面的加载状态。
404响应代码是最常见的代码之一。
通常,任何介于400到499之间的代码都表明该页面未加载。404响应代码是唯一具有特定含义的代码——该页面实际上已消失。
1. 什么是软404错误?
软404错误不是发送到网络浏览器的正式响应代码。
这只是谷歌Google在其索引时添加到页面的标签。
谷歌Google抓取页面时,会仔细分配资源,以确保不会在缺失的页面浪费时间。
但是,有些服务器的配置不正确,当它们应显示404响应代码时,丢失的页面会加载200代码。
即使网页显示未找到该页面,但不可见的HTTP标头仍显示200代码,那么该页面可能会被索引,这对谷歌Google来说是浪费资源。
为解决此问题,谷歌Google注意到404页面的特征,并尝试辨别是否是真的404页面。
换句话说,谷歌了解到,如果它看起来像404,运行起来像404,那么它可能就是一个真正的404页面。
可能被误认为是软404
在某些情况下,该页面实际上并没有丢失,但是某些特征触发了谷歌Google将其归类为丢失的页面。
这些特征包括页面上的内容很少或残缺,以及网站上的相似页面太多。这些特征也类似于熊猫算法( Panda algorithm)要解决的问题。
熊猫更新将稀疏和重复的内容视为负面排名因素。因此,解决这些问题将有助于避免出现软404和熊猫问题。
404错误有两个主要原因:
◇ 链接错误,将用户定向到不存在的页面。
◇ 链接到曾经存在但现在已经缺失的页面。
2. 404错误代码
如果404错误的原因是链接错误,则只需修复链接。
此任务的难点是查找站点上所有断开的链接。
对于具有数千或数百万个页面的大型复杂站点而言,这可能更具挑战性。在这种情况下,爬网工具会派上用场。
您可以尝试使用Xenu,DeepCrawl,Screaming Frog或Botify之类的软件。
不存在的页面
当页面不再存在时,您有两个选择:
◇ 如果页面被意外删除,还原它。
◇ 301重定向到最接近的相关页面。
首先,您必须在网站上找到所有链接错误。
类似于查找大型网站链接中的所有错误,您可以使用爬网工具。
但是,爬网工具可能找不到孤立的页面,孤立的页面是不能在导航链接中的任何位置或任何页面链接中找到。
孤立的页面可能曾经是网站的一部分,在网站重新设计后,指向该页面的链接消失了,但是其他网站的外部链接可能仍在链接到它们。
3. 谷歌控制台Google Search Console
谷歌爬虫抓取页面时,谷歌控制台Search Console会报告404网页。包括网站外链,它们可能会转到您的网站上曾经存在的页面。
谷歌分析报告
默认设置下,您不会在谷歌分析Google Analytics中找到缺失页面报告。
但是,您可以通过多种方式追踪它们。其中一个方式是创建一个自定义报告,并细分出页面标题为“错误404——未找到页面”的页面。
在谷歌分析Google Analytics中查找孤立页面的另一种方法是创建自定义内容分组,并将所有404页分到一个内容组。
4. “site:” 运算符
例如在搜索引擎中搜索 “site:huntusd.com”,将列出被索引的 huntusd.com 的所有页面。
然后,您可以分别检查页面是否正常加载或页面是否为404页面。
为了大规模地做到这一点,您也可以借助一些工具。
由于一个搜索引擎只会为您提供一个子集,因此在多个搜索引擎上运行这些工具可以提供一个更大的列表。并进行批量404检查。
5. 如何修复Soft 404错误
爬网工具不会检测软404错误,因为它实际上并不是404错误。但是您可以使用爬网工具发现其他问题。比如说:
◇ 内容稀少:某些抓取工具不仅会报告内容稀少的页面,还会显示总字数。在这里,您可以根据内容的字词数对URL进行排序。首先从字数最少的页面开始,然后评估页面内容是否充足。
◇ 内容重复: 一些爬网工具非常复杂,足以识别页面内容中同质内容所占的百分比。如果主要内容与许多其他页面几乎相同,则应调查这些页面并确定内容重复的原因。除了抓取工具外,您还可以使用谷歌控制台Google Search Console检查抓取错误的网页内容,以找到软404的页面。
抓取整个网站以查找导致软404的问题所在,可以让您在谷歌Google检测到它们之前就纠正问题。
大多数时候,解决方案似乎是常识。这可能包括简单的事情,例如充实页面内容或用新的内容替换重复的内容。
在此过程中,需要考虑以下几点:
◇ 合并页面: 有时,内容稀少是由于页面主题过于具体所致,这使您无话可说。如果主题相关,则将多个薄页合并为一页。这不仅解决了内容稀少的问题,而且还可以解决重复内容的问题。例如,一个电子商务网站可能为每种尺寸和颜色不同的鞋子提供不同的URL。这使大量页面内容稀少且相似。更有效的方法是将所有内容放到一页上,并列举可用选项。
◇ 查找导致重复内容的技术问题: 即使使用最简单的Web爬网工具,您仍然可以通过查看URL来查找重复的内容问题。其中包括www或非www URL,http和https,是否带有index.html,是否带有跟踪参数等的内容。
谷歌Google以相同方式处理404错误和软404错误
软404并不是真正的404错误,但是如果这些页面不及时修复,谷歌Google会取消收录。最好定期抓取您的站点,查看是否存在404错误或软404错误。
抓取工具应该是您的SEO工具库的重要组成部分。
希望以上能解答您在404错误上的所有疑惑
☀更多跨境电商资讯☀ 尽在海豚岛论坛☜
学习seo并不是很难的事情,但是它得有综合性的技艺。
seo即搜索引擎优化,主要目的是增加特定关键字的曝光率以增加网站的能见度,进而增加销售的机会,开始我们可以理解为就是把某个关键词排名做到搜索引擎的前面去。等理解了这些,就慢慢的可以领悟,慢慢的去发现问题。
1、 如果是新手,当然一开始对那些seo方面的词汇不是很了解。像:关键词、锚文本、内链、外链、标签、流量、pr、动态地址、静态地址等等一些。这是学习seo必须要清楚的东西,如果这些不懂,就不能谈别的了,所以新手入门seo,首先要了解这些东西。
2、了解这些之后,还需了解什么是站内优化,站外优化。这是做seo优化中不可少的,也是最关键的。其中站内优化也包括了上面所说的那些关键词,所掌握的是怎么去运用。站外优化也就是外链方面的增加等等。这个对于新手来说,可以去一些站长类论坛,如站长百科,http://www.zhongchuang520.com/view/seoyhtg/的论坛。
原创文章,作者:普尔小编,如若转载,请注明出处:http://www.puerpx.cn/pxwd/1870.html