本文档起初只是在谷歌内部使用 , 但是我们考虑到 , 也许它对那些刚刚接触搜索引擎优化、 并且希望提高网站与用户和搜索引擎交互性的网站站长们也一样会有帮助 , 所以我们对其进行进一步整理完善 , 发表出来供大家参考。 尽管这个指南不会告诉您怎样做才能使自己的网站排在谷歌搜索结果的第一位 , 但是遵循下文介绍的一些推荐做法会使搜索引擎更容易抓取和索引您网站的内容。
搜索引擎优化通常是指对您网站的某些部分做一些小的改进。 如果个别来看 , 这些改进的效果可能并不那么明显。 但是当和其他的优化结合起来看时 , 它们将对您网站的用户体验以及在搜索结果中的表现有显著的影响。 您可能对此指南中的相当一部分话题已经比较熟悉了 , 因为它们都是构成网页的基本元素 , 但是您可能并没有非常充分地利用这些基本元素。
尽管这个指南的标题含有 “ 搜索引擎 ” 这个词 , 但是我们想说的是您应该将您优化的重心和出发点主要放在用户体验上 , 因为用户才是您网站内容的主要受众 , 是他们通过搜索引擎找到了您的网站。过度专注于用特定的技巧获取搜索引擎自然搜索结果的排名不一定能够达到您想要的结果。 通俗地讲 , 搜索引擎优化就是让您的网站以最理想的姿态出现在搜索引擎的结果中 , 但是您的最终的服务对象是您的用户而不是搜索引擎。您的网站可能比我们作为例子的网站大也可能比它小 , 网站的内容也可能有很大不同 , 但是我们下面讨论的优化主题将适用于所有不同大小和类型的网站。 我们希望我们的指南能够给您在如何改进您的网站方面提供一些启发。 我们会非常乐意在谷歌网站管理员支持论坛上听到您的问题、 反馈以及您的成功案例的。
Googlebot 日夜不停的在互联网上为Google的索引抓取内容 , 从不停息。
举一个例子或许有助于我们进行说明 , 因此我们制作了一个专用网站来进行解释说明。对于每一个主题 , 我们会尽可能地提供关于这个网站的足够多的、详细的信息以论述涉及到的观点。下面是一些关于我们所使用的这个网站的背景信息 :
网站/公司名称 : “Brandon’s Baseball Cards”(布莱顿的棒
球卡片)
域名 : brandonsbaseball.com
主要领域 : 仅限于在线的棒球卡销售、价格向导 , 文章及
新闻内容
网站大小 : 较小 , 250页左右
搜索引擎优化只会影响自然搜索的结果 , 不会影响比如Google AdWords之类的付费链接的结果。
标题标签告诉用户和搜索引擎一个特定网页的主题是什么。<title>标签通常放在HTML文档的<head>标签内(1)。理想情况下 , 您应该为您网站的每一个网页创建唯一的页面标题。
如果您的文档出现在一个搜索结果页面 , 其标题标签的内容通常会 出现在搜索结果的第一行(如果您不熟悉一个Google搜索结果的各个组成部分的话,您可以浏览由Google工程师Matt Cutts主讲的搜索结果剖析视频 , 以及这张颇有帮助的搜索结果页示意图)。标题里的文字如果出现在用户的搜索查询词中的话 , 它们会以粗体显示。这有助于用户识别这个页面是否和他们的搜索相关(2)。
您网站首页的标题可以列出网站或者公司名称和其他一些重要的信息 , 诸如您公司的实际地址 , 一些主要关注的领域或者提供的服务(3)。
搜索引擎: | 搜索查询词: |
利用关键字或其他特定词条搜索互联网上提供的数据的计算机程序。 | 用户在搜索引擎上执行搜索时输入的单个或多个字词。 |
<head>标签: | |
表示HTML文档标头的元素。此元素的内容不会显示在浏览器中。 | |
HTML: | |
超文本标记语言的缩写 , 一种用于描述网页文档的语言。它表示网页的基本元素 ,
包括文档文本、任何超链接和嵌入的图片。 |
|
选择可以有效传达网页内容主题的标题。
请注意避免:
您的每一个网页最好有一个独一无二的标题标签 , 这可以帮助Google将它和其他网页区别开来。
请注意避免:
短的标题同样可以包含丰富的信息。
如果标题太长 , Google只会在搜索结果里显示其部分内容。
请注意避免:
页面标题是搜索引擎优化的一个重要方面!
http://googlewebmastercentral.blogspot.com/2007/11/anatomy-of-search-result.html
http://www.google.com/support/websearch/bin/answer.py?hl=zh-cn&answer=35891
网页的描述元标签为Google和其他搜索引擎提供了关于这个网页的 总括性描述(1)。网页的标题可能是由一些单词和短语组成的 , 而网页的描述元标签则常常是由一两个语句或段落组成的。谷歌网站站长工具提供了内容分析功能 , 对那些太短 , 太长或过分重复的描述元标签做出提醒(对于<title>元标签也会显示同样的提醒)。像<title>标记一样 , 描述元标签也位于您HTML文件的<head>标记中。
描述元标签是非常重要的 , 因为Google可能会使用描述元标签来 生成您网页的摘要。我们之所以说“可能” , 是因为Google有时候也会使用您网页的一段可视文本来作为摘要 , 如果它很好地匹配了用户的查询的话。除此之外 , 如果您曾经注册并被开放目录项目(Open Directory Project)收录的话 , Google也可能会使用您在开放目录项目中的描述作为摘要(点击这里了解怎样防止搜索引擎展示ODP数据)。为每一个网页都添加描述元标签是一个非常好的做法, 这样即使Google在网页上无法找到可以用做摘要的文本 , 也可以使用描述元标签来生成摘要。我们的网站管理员博客中有一篇很有帮助的文章——《使用更好的元描述来改善网页摘要》。如果网页摘要里的某个词语恰好出现在用户的查询里 , 那么这个词语将被高亮显示(2)。这可以帮助用户判断此网页的内容是否符合他(她)想要找的内容。(3)图是另外一个例子 , Google利用一个深层网页的描述元标签(此网页具有非常理想的描述元标签)生成了网页摘要。
摘要: | 域名: |
在搜索引擎的搜索结果页上 , 显示在相关网页标题下方的文本。此处会显示网页摘
要和/或网页中与搜索关键字相匹配的部分内容。 |
表示计算机或网络位置的互联网地址。这些地址会得到妥善管理以确保其唯一性。 |
开放式目录管理系统 (ODP): | |
由用户自主发布的全球最大的网页目录(大规模收集并按类别整理的一系列互联网
链接)。 |
|
我们可以撰写一个既有丰富内容又可以触发用户浏览兴趣的描述元标签。
请注意避免:
这对用户和搜索引擎都有帮助 , 特别是搜索结果中包含多个来自同一域名的网页时(比如 , 使用site : 操作符来搜索时)。如果您的网站有成千上万个网页 , 逐一手写描述元标签已不太现实。在这种情况下 , 您可以根据每一页的具体内容自动生成描述元标签。
请注意避免:
使用描述元标签为搜索引擎和你的用户提供页面内容的总结!
http://googlewebmastercentral.blogspot.com/2007/12/new-content-analysis-and-sitemap.html
http://www.google.com/support/webmasters/bin/answer.py?hl=cn&answer=35264
http://www.google.com.hk/ggblog/googlewebmaster-cn/2008/01/blog-post.html
http://www.brianwhite.org/007/04/7/google-site-operator-an-ode-to-thee/
为您网页上的文件创建具有良好描述性的类目名和文件名不仅可以帮助您更好地组织您的网站 , 还有助于搜索引擎更有效地抓取文 件。而且它还能够为那些想链接到您内容的网站创建更简单、友好的URL。访客可能会被过于冗长、隐秘 , 包含很少可识别单词的URL吓到。类似这样的URL(1)对用户是不友好的 , 而且也会让人困惑。用户在记忆这样的URL和为此创建链接的时候会感到困难。而且用户可能会认为某一部分的URL是不需要的 , 特别是当这个URL显示了很多难以识别的参数的时候。用户凭这种臆断往往会自作主张去掉URL的一部分 , 从而导致链接失效。有些用户可能会运用该页面的URL作为锚文本来链接到您的页面。对用户和搜索引擎来说 , 如果您的URL包含了相关的文字 , 会比单 纯提供一个ID或者奇怪的参数更有帮助(2)。
最后 , 请注意指向页面的URL会作为搜索结果的一部分 , 展示在该 页面的标题和内容摘要下方。就像标题和内容摘要一样 , 如果搜索结果URL中包含的某个词语恰好匹配用户的搜索查询 , 那么该词语会在URL中以粗体显示(3)。右边展示的是另外一个例子 , 在我们域名下的一个URL页面含有一篇关于最稀有的棒球卡的文章。URL中的单词往往会比诸如“www.brandonsbaseballcards.com/article/102125/”中的ID数字更能吸引搜索用户。Google擅长于抓取各类型的URL结构 , 即使它们异常复杂 , 但是花一些时间让您的URL尽可能的简单 , 对于用户和搜索引擎都是有帮助的。有些网站管理员通过将他们的动态URL重写为静态URL的方式来达到这个目的 ; Google觉得这样做没有什么不妥 , 但是我们需要提醒的是 , 这是一件比较考验功力的事情 , 如果操作不当 , 可能会为您网站的抓取带来麻烦。如果您想学习更多的关于好的URL结构的知识 , 我们推荐您参考网站管理员帮助中心的文章——《创建方便Google处理的网址结构》。
抓取: | 301重定向: |
搜索引擎软件(机器人)浏览网站从而将其内容编入索引的过程。 | HTTP状态代码(请参见第12页) , 强行将网站访问者自动跳转到某个指定网址的过
程。 |
参数: | 子域: |
网址中提供的数据 , 用于指定网站的行为。 | 用于识别规模小于正规域(请参见第6页)的类别的一种域类型。 |
ID(会话ID): | 根目录: |
对于当前正在访问系统或网络的用户 , 系统为了识别其身份和/或管理其行为而提
供的数据。 |
位于网站树结构顶端的目录 , 通常称为“根”。 |
选择一个用户和搜索引擎都能容易理解的URL!
包含与您网站内容和结构相关的单词会更便于用户浏览网站。访问者会更好地记住他们并可能更愿意链向他们。
请注意避免:
您的目录结构应该能够很好地归纳您网站内容并且使用户轻松地知道他们处于您网站的哪个位置。尽量使用您的目录结构来指明URL上的内容类型。
请注意避免:
在访问同一内容时 , 为了防止一些用户链接到一个版本的URL而另一些用户链接到另一个版本(URL的不同可能会分散弱化该内容的声誉值) , 我们建议您在您页面的内部链接和结构中集中使用一个URL。如果您发现有用户通过不同的URL来访问同样的内容 , 您可以对不希望使用的URL设立301重定向到您所期望使用的URL。当重定向不起作用时 , 你也可以使用首选域URL或者rel=“canonical”的链接元素。
请注意避免:
动态链接 : | 301重定向: |
http://www.google.com/support/webmasters/bin/answer.py?hl=cn&answer=40349 | http://www.google.com/support/webmasters/bin/answer.py?hl=cn&answer=93633 |
创建Google友好的URL: | rel=“canonical”: |
http://www.google.com/support/webmasters/bin/answer.py?hl=cn&answer=76329 | http://www.google.com/support/webmasters/bin/answer.py?hl=cn&answer=139394 |
网站的导航功能对于搜索引擎而言是非常重要的网站的导航功能对于帮助用户迅速找到他们想要的内容来说是很 重要的。它对帮助搜索引擎理解该网站有哪些重要内容同样非常重要。虽然Google的搜索结果都是指向每一个特定的页面 , 但Google同时也会智能地去理解这一页到底在整个网站结构中处于什么地位。
所有网站都会有它的主页或者“根”页面。这种页面往往是用户访问最多的 , 也是用户检索和浏览该网站的起始点。除非您的网站只有屈指可数的几个页面 , 否则您应该思考一下如何更好地将用户从您 的主页(根页面)带到有特定内容的页面。比如 , 您是否发现有不少页面应该归于同一话题而需要另建一页来归纳展示这类相关的页面?您网站中是不是有成百上千的商品需要利用逐层分类的方法来更有条理地展示?
面包屑导航是指在网页顶端或者底部放置的一排内部链接 , 它使用 户可以方便地回到上一层结构中的网页或者根页面(1)。大多数面包屑导航通常会从最具概括性的页面开始(通常是根页面) , 越往右指向的页面内容越具体。
404(“找不到网页”错误) | XML网站地图 |
HTTP状态代码(请参见第12页) , 表示服务器找不到浏览器请求的网页。 | 特定网站上的网页列表。您可以通过创建和发送此列表 , 告知Google某个网站上
的所有网页 , 包括Google的常规抓取过程可能未检测到的网页。 |
预先考虑到用户可能截取部分URL的情况——有时候我们需要考虑到用户一些特别的行为。例如 , 用户需要浏览某页面上一级或几级的页面时 , 他(她)可能并不使用页面上的面包屑导航链接 , 而是 凭自己的判断去掉URL中属于文件结构中底层的那一部分 , 从而 来访问一些更宏观的内容。他(她)可能正在访问http://www.brandonsbaseballcards.com/news/2010/upcoming-baseball-cardshows.htm , 然后他(她)可能会尝试输入http://www.brandonsbaseballcards.com/news/2010/到浏览器的地址栏 , 希望能浏览该网站关于2010年的所有新闻(2)。此时我们就需要考虑我们是否应当允许用户在这种情况下浏览上级目录内容 , 还是只给他(她)返回一个404(“找不到页面”错误)呢?再者 , 当用户访问再上一级目录http://www.brandonsbaseballcards.com/news/的时候 , 我们又该怎样做呢?
网站地图是您网站上用于展示网站结构的网页 , 它将您的所有网页以层级式列表的方式提供给用户。当用户在寻找某些页面时遇到 了困难 , 他们可能会通过您网站里的网站地图(sitemap)来解决。它的主要目的是为了方便用户 , 但同时它也有利于搜索引擎对您的整个网站页面更全面地抓取。用户也可以通过谷歌网站站长工具提交XML网站地图文档(基于XML的网站地图文档)来让Google更容易地去发现并抓取您网站上 的内容。该文档还有一个好处就是您可以利用它来选择您想要的首选域(例如 : http://brandonsbaseballcards.com/或http://www.brandonsbaseballcards.com/ ; 了解更多首选域相关信息 , 请访问专题什么是首选域)。建立网站地图文档并非难事 , Google已经给您提供了开源的网站地图文档生成脚本(Sitemap Generator script), 让您更方便的制作该文档。倘若您希望了解更多关于网站地图文档相关信息 , 请访问我们网站管理员中心专题关于网站地图。
网站站长工具 | 网站地图生成脚本 |
https://www.google.com/webmasters/tools/home?hl=zh-CN | http://code.google.com/p/googlesitemapgenerator/ |
什么是首选域 | 网站地图使用指南 |
http://www.google.com/support/webmasters/bin/answer.py?hl=cn&topic=9025&answer=44231 | http://www.google.com/support/webmasters/bin/answer.py?hl=cn&answer=156184 |
让用户尽可能容易地从主干页面找到他们需要的特定内容。有必要的话可以在保证内部链接结构合理的基础上添加导航页。
请注意避免:
一方面 , 若您导航中的大部分链接都是文字链接的话 , 搜索引擎会更容易识别和抓取。另一方面 ,用户在很多情况下更喜欢文字链接 , 特别是在某些无法浏览Flash和javaScript的设备上。
请注意避免:
对于导航而言 ,重点在于简单和易用!
Flash | 可访问性 |
由Adobe系统公司开发的网络技术或软件 , 可用于创建包含声音、视频和动画的网络内容。 | 允许用户和搜索引擎访问并了解相关内容。 |
JavaScript | 用户体验 |
一种编程语言 , 可用于向网页添加动态功能 , 被许多网络服务广泛采用。 | 用户在使用产品、服务等过程中所获得的体验。关键在于提供用户真正追求的体验 , 例如“享受”、“便利”和“舒适”。 |
下拉菜单 | HTTP状态代码 |
供用户从菜单中选择内容的系统。当用户点击菜单时 , 系统会以拉出的方式显示选项列表。 | 一种代码 , 用于表示服务器在计算机相互传递信息时所返回响应的含义。该代码由三个数字组成 , 不同的数字组合所代表的含义也不尽相同。 |
网站地图能有效地链接到您网站上的所有页面或主要页面。制作XML网站地图文档能够进一步确保搜索引擎发现并索引您站内的所有网页。
请注意避免:
用户偶尔会因点击失效的链接或输入错误的URL而访问一些在您网站域名下但并不存在的页面。使用自定义404网页能有效地帮助用户回到网站中有效页面 , 这将大大提高用户体验。您的404网页最好能提供回到您网站主页的链接以及到您网站中热门内容页面的链接。Google为您提供了404小工具 , 您可以将其嵌入您的404网页从而自动生成许多有用的功能。您还能通过网站站长工具找到导致“Not Found”(找不到)错误的网址来源。
请注意避免:
Google如何处理Flash、图片和其他非文本文件 | 导致“Not Found”错误的网址来源 |
http://www.google.com/support/webmasters/bin/answer.py?answer=72746&hl=zh_cn | http://googlewebmastercentral.blogspot.com/2008/10/webmaster-tools-shows-crawl-error.html |
自定义404网页 | 404 HTTP状态代码 |
http://www.google.com/support/webmasters/bin/answer.py?answer=93641&hl=zh_cn | http://www.w3.org/Protocols/rfc2616/rfc2616-sec10.html |
404小工具 | |
http://www.google.com.hk/ggblog/googlewebmaster-cn/2008/09/404.html | |
提供高质量的、对用户有益的内容恐怕是本文中讨论的各种要素 里最重要的一部分(1)。用户很容易分辨您提供的内容是否是高质量的 , 并且他们也乐意于通过博客文章、社交媒体服务、电子邮件, 论坛和其他方式向自己的朋友推荐您的网站。口口相传的效应会给您带来更多的用户 , 同时也会提高您的网站在用户和搜索引擎中的声望 , 而这一切都离不开高质量的内容。
您可以想象一下用户可能会用哪些关键词来搜索您的内容。与那些对某一主题感到陌生的用户相比 , 对这个主题非常了解的用户可能会用不同的关键词来搜索这一主题。比如 , 一个资深棒球爱好者可能会用[nlcs](全国棒球联盟冠军赛的缩写)作为搜索词 , 而一个刚刚接触棒球的用户可能就会用一些更通俗的词汇来查询 , 比如[棒球季后赛]。如果您在撰写您的内容时 , 预先考虑到这一点 , 通 过综合使用各种具有潜在搜索可能性的关键词 , 兼顾到不同用户的 搜索习惯 , 那么您将会收到更好的效果。Google AdWords提供了一个很有用的关键词工具 , 这个工具能帮您发现和掌握关键词的变化动向 , 并了解每一关键词的大致搜索量。同时 , 谷歌网站站长工具向您提供了热门搜索查询功能 , 您可以通过这个功能了解您的网站最常出现在哪些搜索查询触发的搜索结果中 , 以及哪些搜索查询给您带来了最多的访问者。
您可以考虑提供一些别的网站没有提供过的新的、有用的服务。您 还可以撰写一篇原创研究报告 , 一篇新的新闻采访或者某种能够发 挥您的独特用户群的优势的方式 , 来吸引更多的用户。其他的网站可能会由于资源匮乏或缺少这方面的专长而无法做到这些。
社交媒体服务 | Google AdWords |
社区类型的网络服务 , 用于促进和支持用户间的沟通联系。 | 在搜索结果页和其他内容上投放相关广告的广告服务。当用户使用Google搜索关键字时 , 与这些关键字相关的AdWords广告就会显示在搜索结果页的右侧、顶部和/或底部的自然搜索结果旁。 |
对任何类型的网站来说 , 提供内容和服务都是头等大事!
用户更喜欢浅显易读的内容。
请注意避免:
有条理地组织您的内容是非常重要也是非常有益的 , 这样您的访问者能够清楚地了解内容的起始和排序。将您的内容按照逻辑划分出层次有益于用户迅速找到他们所需要的内容。
请注意避免:
新颖的内容不仅能帮您招揽回头客 , 还能帮您吸引更多新的访问者。
请注意避免:
您网站的设计首先要考虑用户的需求 , 并同时确保能便于搜索引擎抓取和索引。
请注意避免:
关键字工具: | 重复内容: |
https://adwords.google.com.hk/select/KeywordToolExternal | http://www.google.com/support/webmasters/bin/answer.py?answer=66359&hl=cn |
热门搜索查询: | 隐藏文字和链接: |
http://www.google.com.hk/webmasters/edu/quickstartguide/sub1guide5.html | http://www.google.com/support/webmasters/bin/answer.py?answer=66353&hl=cn |
锚文本是链接上可以被点击的文字 , 它通常被放在锚标记<a href=“…”></a>中。
这个锚文本告诉了用户和Google关于您所链向页面的一些情况。 您页面上的链接可能是内部的——指向您网站的其他页面 , 也可能是外部的——指向其他网站的内容。在任何一种情况下 , 您的锚文本做得越好 , 用户浏览您的网站就越容易 , Google也更容易理解您链接到的页面的内容。
CSS | 文本样式 |
层叠样式表的缩写 , 一种用于定义网页的样式和布局的语言。 | 格式 , 例如文字的字体、大小和颜色。 |
用户和搜索引擎都喜欢容易理解的锚文本!
您选择的用作链接的锚文本应该至少能够提供被链接页面的基本信息。
请注意避免:
尽量使用一些词或短语来写出简短的具有描述性的锚文本
请注意避免:
让用户很容易就能分辨出正常文字和锚文本。如果用户没注意到该链接或者是很容易误点击它们 , 那么这些内容就会失色很多。
请注意避免:
您可能会经常考虑指向外部网站的链接 , 但也应该同时关注用于内部链接的锚文本 , 这样的链接可以帮助用户和Google更好地浏览您的网站。
请注意避免:
图片看起来似乎是网站的组成中比较简单的一部分 , 但实际上您也可以对图片的使用进行优化。所有的图片都可以拥有一个独一无二的名字和“alt”属性 , 您可以对这两个特性加以利用。当图片因为 一些原因不能显示的时候 , alt属性使您可以指定供替换显示的文 字(1)。为什么使用这个属性呢?如果一个用户在浏览您的网站的时候使用的浏览器不支持图片 , 或者他(她)在使用一些类似于屏幕阅读器的设备时 , alt属性的内容就可以提供关于图片的信息。除此之外 , 使用alt属性还有另一个原因。如果您把一张图片作为一个链接 , 此时这个图片的alt属性就能起到与文本链接的锚文本相同的作用。但是 , 当文本链接可以起到同样的作用时 , 我们并不推荐您在网站中使用过多的图片链接。最后 , 优化图片的名称和alt文本可以使类似Google图片搜索这样的图片搜索引擎能更好地理解您的图片。
将您的图片统一保存在一个单独的目录下(比如brandonsbase ballcards.com/images/) , 而不是将图片分散在网站的很多目录和子目录下。这样可以简化链接到您的图片的路径。使用普遍被支持的图片文件类型——大部分的浏览器都支持JPEG , GIF , PNG和BMP格式的图片。同时 , 采用和图片类型相符合的文件扩展名也是很值得推荐的做法。
屏幕阅读器 | ASCII语言 |
用于朗读屏幕信息或输出布拉耶盲文的软件。 | 美国信息交换标准代码的缩写。一种以英文字母为核心的字符编码。 |
就像网页上其他优化的部分一样 , 最好的文件名和alt文本(针对ASCII语言)是简短而描述性很强的。
请注意避免:
如果您打算把一张图片做为链接使用 , 提供alt文本有助于Google更好地理解它链向的那个页面。您可以把它当成在为某一文本的链接书写锚文本一样。
请注意避免:
图片网站地图文件可以将您的网站上的图片相关信息提供给Googlebot。图片网站地图的文件结构和网页XML网站文件结构类似。
学会如何优化站内图片!
|
|
http://images.google.com.hk/ | http://zh.wikipedia.org/wiki/PNG |
|
|
http://zh.wikipedia.org/wiki/JPEG | http://zh.wikipedia.org/wiki/BMP |
|
|
http://zh.wikipedia.org/wiki/GIF | http://www.google.com/support/webmasters/bin/answer.py?hl=cn&answer=178636 |
Heading标签(请不要将其和HTML <head>标签或者HTTP 标头混淆)通常用来为用户呈现网页的结构。HTML语言里一共有六种大小的heading标签 , 从最重要的<h1> , 到<h6> , 权重依次降低(1)。由于heading标签通常会使某些文字比普通的文字大 , 对于用户来说 , 这样可以便于他们更直观地看出这些文字的重要性 , 而且可以帮助 他们理解heading文字下方的内容。多种渐变大小的heading可以为您的内容创建分层结构 , 从而使用户更容易地浏览您的网站。
Heading标签对于吸引用户眼球很重要 , 请仔细使用之!
就像在一张纸上写一份提纲一样 , 找出页面上的要点和分要点 , 然后决定怎样恰当地使用heading标签。
请注意避免:
只在适合使用heading标签的地方使用它。当一个页面上有过多的heading标签 , 会对用户浏览内容和分辨出某个标题的起始带来不便。
请注意避免:
HTTP标头: | 通配符: |
HTTP(超文本传输协议)中 , 在发送实际数据本身前发送的各类数据。 | 用于替代其他任何字符或字符串的字符(*)。 |
<em>: | .htaccess: |
用于表示强调的HTML标记。根据相关标准 , 此标记会通过使用斜体表示强调。 | 超文本访问文件 , 一种可让您管理网络服务器配置的文件。 |
<strong>: | 引用页日志: |
用于表示重点强调的HTML标记。根据相关标准 , 此标记会通过使用粗体表示强调。 | 写入访问日志的引用页信息。用户可以通过跟踪该日志 , 了解访问者查看过的网站。 |
“robots.txt”文件主要用来告知搜索引擎它们是否有权抓取您网站的特定部分(1)。该文件一定要严格的命名为“robots.txt” , 并被放置在网站的根目录下(2)。
您可能不希望您的网站中的某些页面被抓取 , 也许这些网页在搜索结果中出现对于用户来说并没多大用处。如果您想防止搜索引擎抓取这些页面 , 谷歌网站站长工具中有一个非常好用的robots.txt生成器 , 它可以帮您生成这个文件。需要注意的是 , 如果您的网站使用子域名而您不想被抓取的某些网页恰好在一个特定子域名下 , 您需要为那个子域名创建一个单独的robots.txt文件。如果您想了解更多的关于robots.txt的信息 , 建议您参阅网站管理员帮助中心的关于使用robots.txt文件的指南。还有很多别的方法可以保证您的网站的某些内容不出现在搜索结果中 , 比如说给您的robots元标签加上“NOINDEX”标识 , 使用.htaccess文件对需要保护的目录加密 , 还可以使用网站站长工具将已经被抓取的网页从搜索结果中移除。Google工程师Matt Cutts在视频中对如何从Google索引中删除内容进行了介绍(英语)。
掌握如何设置需要抓取和不需要抓取的内容!
您可能不会特别放心仅仅使用robots.txt对敏感的或者保密的内容进行屏蔽。其中一个原因是如果网络上还有一些链接链向这些URL时(比如引用页日志) , 搜索引擎仍然有可能跟踪抓取到您希望屏蔽的URL , 当然 , 它们只会展示您的URL地址信息 , 而不会展示标题或者内容摘要。一些无赖的搜索引擎可能并不会自觉遵守机器人排除标准从而违反您的robots.txt的说明。还有其他原因 , 比如一个好奇的用户可能查看了您robots.txt文件中的目录和子目录 , 并对您不愿对外界展示的内容的URL进行了猜测。使用.htacess文件对内容进行密码保护或者对内容加密是更加安全的措施。
请注意避免:
机器人排除标准 | robots.txt生成器 |
一种规范 , 用于阻止协作网络“蜘蛛”程序/抓取工具(例如Googlebot)访问网站的全部或部分内容 , 而这些内容是可供用户通过其他方式公开查看的。 | http://www.google.com.hk/ggblog/googlewebmaster-cn/2008/03/blog-post_30.html |
代理服务 | 使用robots.txt文件 |
在内部网络和外部网络需要建立连接的情况下 , 用于替代相关连接的计算机 , 或可发挥此作用的软件。 | http://www.google.com/support/webmasters/bin/answer.py?hl=cn&answer=156449 |
如何从Google搜索引擎中删除内容 | |
http://googlewebmastercentral.blogspot.com/2008/01/remove-your-content-from-google.html | |
如果您把某一链接的“rel”属性设置成“nofollow” , 这意味着您是 在向Google传达这样的信息 : 您不希望Google继续跟踪抓取这些 特定链接所指向的页面 , 并且也不希望将自己网页的声誉传给这些 链接指向的网页。实现这样的效果其实很简单 , 您只需将rel=“nofollow”放置在链接的锚标签里即可(1)。我应当在什么情况下使用nofollow呢?如果您网站的博客开通了留言功能 , 这些留言中含有的链接会向一些您根本就不了解也无意推荐的网站传递您的声誉。博客的留言本经常被垃圾留言所侵扰(2)。Nofollow这些用户生成的链接能够确保您不会将自己好不容易才积累起的声誉传递给其他的垃圾网站。
许多博客软件包会自动nofollow用户的留言 , 即使没有提供这样的自动功能 , 您也完全可以手动调整成这样。同样的情形还适用于您网站的其他由用户生成的内容 , 比如留言簿、论坛、引用通告等。如果某些第三方(比如您的网站信任此留言者)添加的链接得到您的肯定的话 , 那么您就没有必要对这些链接使用nofollow。但是必须明确的是 , 如果您链向了某些被Google认为是垃圾的网站的话 , 那 么您自己网站的声誉也会受到影响。网站管理员中心向您提供了更多关于怎样防止垃圾留言的小建议 , 比如使用CAPTCHAs(输入验证码环节)和启用留言监控功能等(3)。
垃圾评论 | CAPTCHA |
指发布在博客评论栏或留言板上的混乱评论 , 这些评论通常与所在网页的内容没有
关联 , 仅用于宣传广告等内容。 |
全自动区分计算机和人类的图灵测试。 |
Nofollow的另一个用途就是 , 当您在写文章并引用某个网站 , 但是 并不想把您的声誉传递给它。例如 , 您正在撰写一篇关于垃圾留言的博客文章并打算揭发一个最近经常在您的博客上恶意留言的网站。为了籍此提醒其他的网站提高警惕 , 您把该网站的链接包含在了您的文章中 ; 但是 , 您显然不想将自己网站的声誉传递给这个作恶的网站。那么这时候使用nofollow再合适不过了。另外 , 如果您打算nofollow您网页上的所有链接 , 您可以在您的robots元标签中使用“nofollow” , 这个robots元标签就在您网页HTML的<head>标记中(4)。网站管理员中心博客曾经发表过一篇使用robots元标签的文章。这种方式通过<meta name=“robots”content=“nofollow”>就可以实现。
确保你拥有有效的方法对付垃圾留言!
防止垃圾留言: |
http://www.google.com/support/webmasters/bin/answer.py?hl=cn&answer=81749 |
使用robots元标签 |
http://googlewebmastercentral.blogspot.com/2007/03/using-robots-meta-tag.html |
我们的世界似乎正日趋移动化 , 许多人每天都要使用手机 , 还有大量用户会通过Google移动搜索进行搜索。但对网站站长来说 , 要运营移动网站并打入移动搜索用户群中却并非易事。移动网站不 仅与普通桌面网站所使用的格式不尽相同 , 而且所需的管理方式和 专业知识也大相径庭。这就带来了各种新的挑战。虽然许多移动网站在设计时考虑到了移动因素 , 但未能提供高质量的搜索体验。下面提供了一些问题排查提示 , 有助于确保Google正确抓取您的网站并将其编入索引 :
如果即便使用site : 运算符 , 您的网站也未显示在Google移动搜索结果中 , 则该网站可能存在以下一个或两个问题 :
Googlebot必须先抓取您的网站 , 然后才能将其收录到我们的搜索索引中。如果您的网站是刚刚创建的 , 那么我们可能还未发现它。如果是这种情况 , 请创建移动网站地图并提交给Google , 以告知我们该网站的存在。与标准网站地图相同 , 您可以使用谷歌网站站长工具提交移动网站地图。
确保您的移动网站可被Google正确识别 , 这样搜索用户才能找到它。
移动网站地图: | 移动XHTML: |
包含手机专用的网页网址的XML网站地图。向Google提交手机网络内容的网址 ,以便告知我们这些网页的存在 , 并允许我们进行抓取。 | XHTML是一种通过HTML到XML的转换进行重新定义后 , 再扩展为供手机使用的标记语言。 |
User-Agent: | 紧凑型HTML: |
用户在访问网站时使用的软件和硬件。 | 与HTML类似的标记语言 , 可用于创建能在手机上显示的网页 , 也可以与个人手机系统(PHS)和掌上电脑(PDA)结合使用。 |
某些移动网站不允许除手机以外的任何设备进行访问 , 这样 ,Googlebot就无法访问此类网站 , 进而导致用户搜不到该网站。我 们针对移动网站的抓取工具是“Googlebot-Mobile”。如果您希望我们抓取您的网站 , 则请允许包括“Googlebot-Mobile”在内的所 有User-Agent访问您的网站(2)。另请注意 , Google可能会在不另行通知的情况下随时更改User-Agent信息 , 因此 , 我们建议您不要检查User-Agent是否与“Googlebot-Mobile”(当前的UserAgent)完全一致 , 而应检查User-Agent标头是否包含字符串“Googlebot-Mobile”。您也可以使用DNS查询验证Googlebot。
Googlebot-Mobile抓取您的网址后 , 我们会逐一检查 , 看看它们是否都可以通过移动设备访问。如果我们确定某些网页无法通过移动 设备访问 , 则不会将其收录到移动网站索引中(虽然可能会将其收录到一般网页索引中)。此决定是依据多种因素做出的 , 其中包括“DTD(文档类型定义)”声明。请检查可通过移动设备访问的网址的DTD声明是否采用了适当的移动格式 , 例如移动XHTML或紧凑型HTML(3)。如果采用的是兼容格式 , 那么相关网页也是可以收录到移动搜索索引中的。有关详情 , 请参阅移动网站站长指南。
Google的移动搜索页: | 使用谷歌网站站长工具提交网站地图: |
http://www.google.com.hk/m/ | http://www.google.com/support/webmasters/bin/answer.py?hl=cn&answer=156184 |
site : 运算符 | 使用DNS查询验证Googlebot: |
http://www.google.com/support/webmasters/bin/answer.py?hl=cn&answer=35256 | http://www.google.com.hk/ggblog/googlewebmaster-cn/2008/02/googlebot.html |
移动网站地图: | 移动网站站长指南: |
http://www.google.com/support/webmasters/bin/topic.py?hl=cn&topic=8493 | http://www.google.com/support/webmasters/bin/answer.py?answer=72462 |
对同时运营移动版和桌面版网站的网站站长而言 , 一个最常见的 问题就是对使用台式机的用户显示了移动网站 , 或者对手机用户 显示了桌面版网站。要解决此类情况 , 您可以使用下面两种可行的方案 :
当手机用户或抓取工具(如Googlebot-Mobile)访问桌面版网址时 ,您可以将他们重定向到同一网页的移动版。Google在发现该网址 的两种版本间的关系后 , 会向通过台式机搜索的用户显示桌面版 , 并向通过手机搜索的用户显示移动版。如果您要重定向用户 , 请确保相关移动版/桌面版网址上的内容尽可能一致(1)。例如 , 如果您运营的是购物网站 , 而某个用户在手机上访问了该网站的桌面版网址 , 则请务必将该用户重定向到同一商 品的移动版网页 , 而不是移动网站的首页。有时 , 我们发现某些网站会试图使用此类重定向提高其搜索排名 , 但这种做法只会造成不良的用户体验 , 因此无论如何都请避免。另一方面 , 当用户通过桌面浏览器或当Googlebot访问移动版网址时 , 则无需将他们重定向到桌面版。例如 , Google不会自动将桌面用户从移动网站重定向到桌面版网站 , 而会在移动网站上添加指向桌面版网站的链接。当移动网站无法提供桌面版网站的完整功能时 , 这些链接就显得非常实用了 , 用户可以根据需要轻松导航到桌面版网站。
重定向: |
浏览网站时 , 系统自动将用户从某个特定网页转到另一特定网页的过程。 |
某些网站的桌面版和移动版内容所使用的网址相同 , 但会根据不同的User-Agent更改相应的格式。换句话说 , 移动用户和桌面用户访问的网址相同(即不存在重定向) , 但该网站会根据不同的UserAgent对内容/格式稍作更改。在这种情况下 , 移动搜索和桌面搜索 获得的网址相同 , 但桌面用户看到的是桌面版内容 , 而移动用户看 到的则是移动版内容(2)。不过请注意 , 如果您的网站配置不正确 , 则可能会被视为隐藏真实内容的网站(cloaking) , 这会导致我们从搜索结果中将其删除。隐藏真实内容是指试图通过向Googlebot(而非一般用户)发送不同的内容 , 从而提升搜索结果排名的行为。这样做会引起一些问题 , 例如搜索结果的相关程度不高(即使某网页的内容与用户所需内容毫无关联 , 该网页还是会显示在搜索结果中) , 因此我们会严查隐藏真实内容的网站。
如果针对同一网址提供两个版本 , 那么“向用户显示的网页”要怎么理解?正如我之前提到的 , Google会将“Googlebot”用于网页搜索 , 而将“Googlebot-Mobile”用于移动搜索。您应将一般桌面用户 看到的内容发送给Googlebot , 而将通过一般移动设备上的浏览器 访问的用户所看到的内容发送给Googlebot-Mobile , 这样才符合 我们的指南。发送给Googlebot的内容与发送给Googlebot-Mobile的内容可以有所不同。
系统误将您的网站检测为隐藏真实内容的示例 : 如果您的网站向桌面浏览器返回类似于“请通过手机访问”的讯息 , 但随后又向两个抓取工具返回完整的移动版内容(这样Googlebot也收到了移动版内容)。在这种情况下 , 网页搜索用户看到的网页(例如“请通过手机访问”)与Googlebot抓取的网页(例如“欢迎访问我的网站”)是不同的。再次强调 , 检测隐藏真实内容是因为我们希望向用户提供的内容能够与Googlebot或Googlebot-Mobile抓取的内容相同。
(2)根据User-Agent更改网页格式的示例。在此情况中 , 桌面用户应与Googlebot看到的内容相同 , 而移动用户则应与Googlebot-mobile看到的内容相同。
请务必将用户引导至适用于其设备的相应网站!
Google移动搜索: |
http://www.google.com.hk/m/ |
隐藏真实内容(Cloaking): |
http://www.google.com/support/webmasters/bin/answer.py?answer=66355 |
大多数链向您网站的链接需要逐渐积累 , 因为人们总是通过搜索或者其他途径认识到了您的网站 , 之后才会链接向它。作为网站站长的您很希望别人也能了解到您在内容方面花了很大的精力 , Google很能理解这一点。有效地推广您的新内容会让那些对同样话题感兴 趣的人更快地发现您的网站(1)。如同本指南中提到的其他要素一样, 过于极端地使用这些建议可能会损害您网站的声誉。
在您自己的网站上写一篇博客让您网站的访问者知道您添加的新内容,这其实是宣传新内容或新服务的一个非常好的途径。其他经 常访问或者使用RSS feed的网站管理员也会看到这篇博客文章。 不要忽略线下推广——多花些精力在线下推广您的公司或者网站也会很有成效。例如 , 如果您有一个商业网站 , 千万不要忘记把网站的URL放在您的名片 , 信件抬头和宣传彩页上。您也可以给客户发出商业咨询 , 让他们知道您的网站上添加了新的内容。如果您有一个本地业务 , 你可以把相关信息添加到“Google地方信息”里 , 这样使用Google地图和Google搜索的用户就能够访问到 这些信息。在网站管理员中心里可以找到更多如何推广您的本地业务的技巧。
RSS feed |
包含有完整或总结性的描述网站或者博客更新的数据源。RSS是“RDF SiteSummary”的缩写 ; 使用同类型数据结构的服务也称为Atom. |
很多网站都围绕用户互动和交流 , 这使得那些有特定兴趣的用户找到相关的内容变得更加容易。
请注意避免 :
您很可能会发现有些网站的主题跟您的相似。与这样的网站建立沟通往往大有裨益。您参与的论
坛或社区里的热门话题会激发您和社区网站更多的灵感 , 创建更好的网站内容或社区资源。
请注意避免 :
Google地方信息: |
http://www.google.com/local/add/analyticsSplashPage?hl=zh-CN |
推广您的本地业务: |
http://www.google.com/support/webmasters/bin/answer.py?hl=cn&answer=92319 |
主要的搜索引擎 , 包括Google , 都提供免费的网站站长工具。谷歌 网站站长工具能够帮助网站站长更好地掌控自己的网站与Google 进行互动 , 同时也能从Google获得关于自己网站的有用的信息。 使用网站站长工具并不会使您的网站得到任何的特殊待遇 ; 但是 ,它可以帮助您发现可能存在的问题 , 会帮助您的网站在搜索结果中有更好的表现。通过这个服务 , 网站站长们可以 :
雅虎(Yahoo! Site Explorer)和微软(Live Search Webmaster Tools)也都给网站管理员提供了免费的工具。
如果您已经利用谷歌网站站长工具或者其他服务改善了抓取和索引 , 您或许也会对您网站的流量感兴趣。Google分析等网络分析软件是对网站流量进行深入分析的非常重要的工具。您可以利用它们来 :
对于高级用户 , 综合来自分析服务的数据包 , 以及服务器日志文件, 就可以对访问者如何与您的网站进行互动得出更详尽的分析(比如用户还用哪些其他的关键词搜索到了您的网站)。最后 , Google还提供网站优化器的工具 , 这个工具可以让您通过实验找出在网页上什么样的改变可以达到最佳转换率。综合利用网站优化器、Google分析服务和谷歌网站站长工具(您可以观看关于使用“Google Triifecta”的视频)对改进您的网站大有裨益。