解决网站索引问题是SEO人最困难的问题之一。如果您运行一个大型网站(超过 100 万个页面),这个问题可能会非常困难,以至于您甚至晚上无法入睡。
Google Search Console 索引概览中显示“已抓取 – 尚未编入索引”、“已发现 – 尚未编入索引”、“重复页面(Google 选择的规范页面与用户输入的页面不同)”、“重定向错误” ”和其他问题都是令人头疼的问题。
在本文中,我们将探讨如何使用解决“已发现 – 尚未索引”问题。我希望它能帮助大家成功增加网站量。
已发现 – 未索引是什么意思?
根据 Google 官方文档,Discovered 的意思是 – 目前未编入索引“Google 已发现该页面,但尚未抓取它。这通常意味着 Google 想要抓取该 URL,但预计会导致网站超载,因此 Google 重新安排了抓取时间。因此,该页面的上次抓取日期在报告中为空白。”
来自 Google 从所提供的解释来看,“已发现 – 尚未编入索引”的原因似乎只是技术原因 – Google 试图抓取该 URL ,但该网站已超载,Google 会重新安排未来的浏览时间。不过,很多朋友可能也会发现,有时候等啊等,却没有等到Google再次过来。 “已发现 – 尚未编入索引”页面的数量不断增加。
这是因为,除了抓取预算原因之外,Google“已发现 – 目前未编入索引”的另一个原因可能是您的网站未达到一定的质量阈值。
尽管谷歌是世界上最大的公司之一,但在计算能力方面它的资源也有限。它不保证每个网页都会被抓取和索引,从而为被认为有价值和高质量的网站留下有限的资源。
5 个“已发现 – 尚未编入索引”的解决方案
1。提交索引请求
如果您只看到少数页面出现“已发现 – 尚未索引”问题,请尝试通过 Google Search Console (GSC) 请求索引。
操作步骤:打开 Google Search Console > 选择您要启动的网站对应的网站 > 在“检查网站 URL”下输入出现“已发现 – 尚未索引”问题的 URL > 如果该 URL当前尚未编入索引的索引,请单击“请求编入索引”按钮 > 如果一切顺利,您应该会看到一条消息,表明该 URL 已添加到优先抓取队列中。
注意:您可以提交的网址数量是有限的,尽管Google没有具体说明这一点,您通常每天可以提交10-15个网址。因此,这种方法适用于只有少量页面标记为“已发现 – 尚未编入索引”的网站。
2。提高内容质量
Google 无法抓取网络上的所有内容并将其编入索引。谷歌将专注于抓取更高质量的页面,并可能完全跳过抓取较低质量的页面。因此,如果您的网站有大量内容处于“已发现 – 当前未编入索引”状态,您可能需要重点解决页面内容质量问题。
此外,Google 的 John Mueller 提到“已发现 – 未编入索引”可能是由于网站范围内的内容质量问题造成的。这也解释了为什么谷歌在抓取之前会判定一个网站质量较低——因为它可能是基于它已经抓取过的类似网站作为参考。如果 Google 在您的网站上抓取的大部分网页质量都很低,那么 Google 有理由认为它不抓取的其余网页的质量也很低。
以下是一些常见的低质量内容类型:
内容短 – 300 个字或更少
重复内容 – 与其他网页非常相似的内容
内容写得不好 – 没有提供任何价值
人工智能生成的内容 – 人工智能驱动的写作工具越来越受欢迎,但它们很少在没有人工输入的情况下产生有用的内容。
机器翻译的内容 – 如果您使用翻译工具来本地化您的内容,翻译将不太令人满意。在这种情况下,它对搜索者来说并不是特别有帮助。
抄袭内容 – 我认为不言而喻,从其他网站获取内容并试图隐藏其受版权保护的内容的想法是肮脏的并且存在法律问题。
总体而言 – 确保您发布的内容值得在 Google 搜索中建立索引。谷歌更有可能发布新鲜、原创且对搜索用户具有真正价值的内容。 如果你的内容质量很差,要么改进它,要么告诉搜索引擎不要索引它,以便搜索引擎可以先抓取更重要的页面。
3。建立良好的内部链接
内部链接是指从您网站的一个页面到另一个页面的链接。 Google 通常认为内部链接很少的页面的 URL 不重要,并且可能对他们没有用处。索引它。通过正确使用内部链接,您可以帮助Googlebot找到您网站的内容并增加其获得高排名的机会。内部链接的一些最佳实践包括:
确定您的主要内容并将其他页面链接到它
基于层次结构的链接页面,例如将主页链接到辅助页面,反之亦然
不要切换 – 锚点文本优化
指孤岛页面
4. 抓取预算优化
“已发现 – 尚未编入索引”也可能是由有限的“抓取预算”引起的。 Google 在抓取网络上投入的时间和资源通常称为“抓取预算”。决定网络抓取预算的因素有:
浏览容量限制:Googlebot 不希望在抓取您的网站时使您的服务器超载。为了防止这种情况,Googlebot 会计算最大抓取容量,即 Googlebot 可用于抓取网站的最大并发加载并行连接数,以及抓取之间的时间延迟。
抓取要求: Google 在抓取网站时通常会根据网站的大小、更新频率、页面质量和相关性(与其他网站相比)来分配抓取时间。
任何网站都可能遇到浏览预算问题。然而,这种情况在较大的网站上更为常见。网站越大,由于抓取预算不足而出现未抓取页面的可能性就越大。增加浏览预算的方法只有两种。一是增加服务器容量以方便浏览,二是增加网页内容对搜索用户的价值。两者相比,后者更为重要。根据Google官方文档,可以遵循以下最佳实践来最大限度地提高抓取效率:
(1)管理URL目录
使用适当的工具告诉Google哪些页面可以抓取,哪些页面不可以抓取。如果 Google 花费太多时间来抓取不适合编制索引的网址,Googlebot 可能会认为不值得抓取您网站的其余部分(或因此增加您的抓取预算)。具体措施包括:
整合重复内容
使用 robots.txt 屏蔽对搜索引擎不重要的页面
对于永久删除的页面返回 404 或 410 状态代码❝4 E40 软错误 立即更新站点地图
避免使用长重定向字符串
(2) 提高网页加载速度
如果 Google 可以更快地加载和呈现您的网页,它可以让您在每个网页上阅读更多内容。
(3) 监控网站抓取
监控您的网站在抓取过程中是否存在可用性问题,并寻找提高抓取效率的方法。
(4) 避免服务器过载
服务器过载(响应速度比预期慢)也可能导致浏览问题。如果 Googlebot 由于您的服务器过载而无法访问某个页面,它将减少其浏览活动(浏览请求)。这可能会阻止您的某些内容被浏览。 Google 将来会尝试重新访问您的网站,但整个索引过程将被延迟。您可以通过检查 Google Search Console 中的浏览统计信息或托管服务器上的浏览日志来检查服务器的状态。如果您发现平均响应时间增加和 5xx(服务器过载)错误代码增加,请考虑升级您的网络托管基础设施或提高网站性能。
5。增加外部链接的数量
外部链接是Google用来确定页面是否有价值和值得抓取的信号之一。如果您的网站没有或很少有优质的外部链接,这可能是Google不“喜欢”抓取的原因之一。因此,获得高质量的反向链接也将有助于谷歌更快地发现您的内容并为其建立索引。
结论
“已抓取-尚未索引”正在成为一个越来越普遍的问题,也给各大站长(尤其是大型网站的站长)带来了很大的“问题”。如果您在 Google Search Console 中看到“已发现 – 目前未编入索引”,请浏览上述解决方案以找到适合您的解决方案。还值得注意的是,这种情况经常发生在新网站上 – 这是合理的。如果您的新网站出现这种情况,那么您应该做的主要事情就是继续发布优质内容并优化您的内部链接结构。随着时间的推移,这个问题自然会自行解决。
原创文章,作者:andy,如若转载,请注明出处:https://www.52foreigntrade.com/2023109054.html