为了让着陆页、博客、主页和其他在线内容展示在 Google 搜索引擎结果中,您必须确保您的网站可编入索引。从根本上说,谷歌索引是一个数据库。
当人们使用搜索引擎查找内容时,Google 会利用其索引来提供相关内容。如果您的页面未编入索引,Google 的搜索引擎中则不会出现相关内容。如果您想要通过自然搜索来提升网站的自然流量,那将是件很难的事情。
本指南提供了有关索引及其重要性更多的详细信息,还解释了如何查看您的页面是否已编入索引,如何解决导致索引问题的常见技术SEO问题,以及如何快速让谷歌对尚未索引的网站重新进行索引。
·什么是 Google 的索引?
·为什么网站索引很重要?
·如何查看Google是否索引了我的网站?
·Google索引网站需要多长时间?
·如何让谷歌索引我的网站?
·优化Robots.txt 文件
·确保所有的 SEO 标签都是合法的
·仔细检查网站架构,以确保内部链接和有效的反向链接是正确的
·重点处理优质内容
·深入了解网站的 SEO
什么是 Google 索引?
Google索引仅仅是搜索引擎所了解的所有网页列表。如果 Google没有 将您的网站编入索引,则您的网站将不会出现在Google 的搜索结果中。
就像您写了一本书,但是没有任何一家书店售卖或任何一个图书馆收藏您那本书。没有人寻找这本书,人们甚至可能不知道这本书的存在。如果读者在找那本书,他们会很难找到。
为什么网站索引很重要?
未编入索引的网站不会出现在Google 的数据库中。因此,搜索引擎无法在其搜索引擎结果页面 (SERP) 中显示这些网站。
为了索引网站,Google 的网络爬虫 (Googlebot) 需要“抓取”该网站。我们详细了解下可抓取性与可索引性之间的区别。
以下是搜索引擎流程的快速概览,我们可以将其当作复习内容:
爬行:搜索引擎机器人对网站进行爬行,以确定其是否值得索引。Web spiders或“Googlebot,”一直在网络上爬行,跟踪现有网页上的链接,寻找新的内容。
索引:搜索引擎将网站添加到其数据库中(其“索引”是根据Google 的情况)。
排名:搜索引擎根据相关性和用户友好性等指标对网站进行排名。
索引只是说明该网站存储在谷歌的数据库中,并不意味着其会出现在SERPs的顶端。索引由预先确定的算法控制,这些算法考虑了网络用户需求和质量检查等因素。Spiders是如何找到在线内容,您可以通过解决这个问题来支配索引。
如何查看谷歌是否索引了我的网站?
您肯定希望自己的网站被索引——但是您怎么知道它被索引了呢?幸好,搜索引擎巨头通过网站搜索很容易找到您的位置。以下教您如何查看:
1、转到Google的搜索引擎。
2、在 Google 搜索栏中,输入“site:example.com”.
3、当您查看搜索栏下方时,您会看到 Google 结果类别“全部”、“图片”、“新闻”等。在此下方,您会看到被Google索引的网页的大概数量。
4、如果出现数量为0,则该页面未编入索引。
或者,您可以使用 Google Search Console 来查看您的页面是否已编入索引。帐户是可以免费建立的。以下是获取所需信息的方法:
1、登录 Google Search Console.
2、点击“索引”。
3、点击“覆盖范围”。
4、您将看到被索引的有效页面数。
5、如果有效页面的数量为0,则说明谷歌没有为您的页面建立索引。
您还可以使用Search Console检查特定页面是否已编入索引。只需将 URL 粘贴到 URL 检查工具中即可。如果该页面已编入索引,您将收到“URL 在 Google 上”的信息。
谷歌索引网站需要多长时间?
谷歌可能需要几天到几周的时间才能为网站编制索引。 如果您刚刚启动一个页面却发现它没有被编入索引,您难免会感到沮丧。人们怎么通过谷歌发现您漂亮的新网页呢?还好,您可以采取一些步骤来提高索引效率。下面,我们讲解一下通过哪些方法可以加快这个过程。
如何让谷歌索引我的网站?
获取站点索引的最简单方法是通过Google Search Console请求索引。为此,请进入 Google Search Console 的 URL 检查工具,将您要编入索引的 URL 粘贴到搜索栏中,然后等待Google 检查该 URL。如果 URL 未编入索引,请单击“请求索引”按钮。
注意:谷歌在2020年10月暂时禁用了请求索引工具。但是,请求索引工具刚刚在Search Console中恢复!
然而,谷歌索引需要时间。 正如前面所说的,如果您的网站是刚建立的,其不会突然间被编入索引。 此外,如果您的网站未正确设置以适应 Googlebot 的抓取,则它可能根本不会被编入索引。
无论您是网站所有者还是在线营销者,您都希望自己的网站能被有效地索引。以下为您讲解如何使网站被有效地索引。
优化Robots.txt 文件
Robots.txt 是 Googlebot 识别自己不能抓取的网页的指标文件。来自 Bing 和 Yahoo的搜索引擎蜘蛛也能识别 Robots.txt。您将使用 Robots.txt 文件来帮助爬虫优先处理更重要的页面,这样就不会使您的站点因请求而过载。
尽管这一切听起来可能有点专业,但这归结为要确保您的页面可抓取,您可以通过我们的 On Page SEO Checker 获得更多帮助以找出答案。On Page SEO Checker 提供优化反馈,包括技术编辑,例如页面是否被阻止抓取。
确保您所有的 SEO 标签都是合法的
SEO 标签是另一种引导搜索引擎蜘蛛(如 Googlebot)的方式。您必须优化两种主要类型的 SEO 标签。
Rogue noindex标签:这些标签告知搜索引擎不要索引页面。如果某些页面未编入索引,则可能是它们存在noindex标签。我们来查看这两种类型的标签:
元标签:您可以通过查找“noindex 页面”警告来查看网站上的哪些页面可能有 noindex 元标签。如果页面被标记为 noindex,请删除元标记以将其编入索引。
X-Robots-Tag:您可以使用 Google 的 Search Console 查看哪些页面的 HTML 标头中有 X-Robots-Tag。使用上述 URL 检查工具。进入页面后,查找对“允许索引?”的响应。如果您在‘X‑Robots-Tag’ http 标头中看到“No: ‘noindex’ detection”字样,则您知道需要删除X-Robots-Tag。
规范标签:规范标签告诉爬虫某个版本的页面是首选的。如果某个页面没有规范的标签,Googlebot会识别出其是首选页面,也是该页面的唯一版本,并将为该页面建立索引。如果某个页面确实有规范标签,Googlebot会假设该页面有一个替代的首选版本,并且不会为该页面编制索引,即使其他版本不存在。使用谷歌的网址检查工具来检查规范标签。在这种情况下,您将看到一条警告,内容为“带有规范标签的替代页面”
仔细检查网站架构,以确保内部链接和正确有效的反向链接
内部链接帮助爬虫找到您的网页。非链接页面被称为“孤立页面”,很少被索引。正确的站点架构,如网站地图中所显示的,确保了内部链接的正确性。
XML 网站地图列出了您网站上的所有内容,让您可以识别未被链接的页面。以下是内部链接最佳实践的更多技巧:
消除 nofollow 内部链接。当 Googlebot 遇到 nofollow 标签时,Googlebot会向 Google 发出信号,表明自己必须从其索引中删除带有标签的目标链接。从链接中删除 nofollow 标签。
添加排名靠前的内部链接。如前所述,spiders通过抓取您的网站来发现新内容。内部链接加快了这一进程。通过使用高排名页面在内部链接到新页面来简化索引。
生成优质的反向链接。 Google 认识到,如果页面始终被权威网站链接到,则这些页面是重要且可信的。反向链接告知 Google 页面需要被索引。
重点处理优质内容
优质内容对于索引和排名都至关重要。为确保您网站的内容是高性能的,请删除低质量和性能不佳的页面。
这使 Googlebot 能够专注于您网站上更有价值的页面,从而更好地利用您的“抓取预算”。此外,您希望网站上的每个页面都对用户有作用的,而且,内容必须是独特的,内容重复可能是 Google Analytics 的危险信号。
深入了解网站的 SEO
无论您是管理公司网站的网管、受聘的JavaScript程序员还是独立的博客作者,基本的SEO都是必备技能。SEO听起来可能很吓人,但就算您不是专业人员也能了解透彻。