给网站管理员的建议:创建可利用的、可抓取的网站



原文:Webmaster tips for creating accessible, crawlable sites
发表于:2008年4月14日 上午10:47

Raman and Hubbell at home

Hubbell和我正在我们位于加州的家中度假。欢迎您随时
阅读在此之前我为网站管理员们写的关于可用性的博客,
以及我为谷歌官方博客所写的其他文章


对于Accessible search,网站管理员们最经常问的一个问题就是:我怎样才能提高我的网站在Accessible Search上的排名?同时,网站管理员们还会问一个与之类似、但更为宽泛的问题:怎样才能提高我的网站在Google搜索上的排名?

我很高兴地告诉大家,这里有一个一举两得的办法:您可以建立和完善一些关键的网站特性,比如网站导航,这样它就能为所有用户服务,其中自然也包括谷歌机器人。下面是一些小建议,您可以参考。

确保所有重要的内容都能正常访问

为了使用户获取到内容,必须确保这些内容是可以访问的。用户及搜索引擎机器人都是借助超文本链接获取页面内容的,所以关键的第一步是确保您网站上的所有内容都可经由纯
HTML超文本链接访问到,并避免网站的关键部分被JavaScriptFlash等技术隐藏起来。

纯超文本链接是指通过HTML锚元素<a>生成的链接。下一步,我们要确保所有超文本链接指向的目标,即<a>元素,都是真实的URL,而不是一个空的、真正的链接行为已经被转到点击触发控制器上的链接。

简而言之,要避免下列超文本链接的形式:

<a href="#" onclick="javascript:void(...)">Product Catalog</a>

我们推荐更简单的链接,如:

<a href="http://www.example.com/product-catalog.html">Product Catalog</a>

确保内容的可读性

只有具有可阅读性,网站内容才能发挥作用。请确保您网站上所有的重要内容都以HTML文件的形式呈现,并且在无须评估页面脚本的前提下就可以获取。对于谷歌机器人和绝大多数不知情的用户而言,Flash动画背后隐藏的内容和由可执行性JavaScript在浏览器端所产生的文本仍然是无法读取的。

确保内容按照适于阅读的顺序提供给读者

在获取可读内容后,用户希望能够按照合乎逻辑的阅读顺序跟进内容。如果您网站中的大部分内容采取了复杂的多栏布局设计,不妨退回去考虑一下您如何才能实现预期的效果。例如,使用深层嵌套的HTML表格会使人们难以将相关的文本按照合乎逻辑的顺序联系起来。

在HTML内使用CSS以及合乎逻辑、有组织的<div>元素,可以取得同样的效果。同时作为一个额外的收获,您会发现您的网站运行得更加快捷高效。

补充所有的视觉内容――不必担心重复!

让所有人都可以获得您的信息并不意味着让您把网站"降格"成为最简单的文本格式。最大限度地重复您的信息是很重要的,因为只有这样才能确保页面内容最大限度地帮助所有用户。这里有几个简单的小建议:
  • 确保在图片缺失的情况下,用户仍然可以获得那些通过图片传播的内容。这不仅要在相关的图片上添加适当的ALT属性,还要确保图片周围的文字能够详细地介绍背景,让读者了解为什么这张图片会出现在这里;同时详细给出您期望人们看到这个图片后所得出的结论。简言之,如果您想确保每个人都知道此图片表现的是一座桥梁,那么您最好把该图片周围的文字也以拱形排列。

  • 添加相关的摘要和标题,让读者在钻研细节之前可以获得高屋建瓴的信息概述。

  • 在数据展示之类的视觉形象旁边添加详细的文字总结。
采纳上述建议可以大大提高用户登陆页面的质量。同时,作为一个额外的收获,您还很有可能惊喜地发现您的网站得到了更好地索引!

Labels: , , ,



8个评论:

声明:以下评论仅代表发表者观点。

现在谷歌中文网站管理员博客越来越向站长看齐了

确实很精到,该这样来操作。

好郁闷啊,为什么我订阅不了咱们的RSS呢,无论是在线的还是离线的,都不能订阅。。。。

但是,链接的格式那种最有效呢?比如我现在的链接格式,以文章名称作为链接内容——google搜索机器人会认识中国字吗?还是必须要翻译成英语才行?

例如:http://www.lipuman.com/archives/facebook%e7%ae%80%e4%bd%93%e4%b8%ad%e6%96%87%e7%bd%91/

关于谷歌抓取的,发现一个新问题:如果外部链接有拼写错误的话,会在网站管理员工具报为无法访问的网址.这不是网站的错,而是外链接的错误.
谷歌对这类错误是不是会算在我们网站上呢?还是只算在发出链接的网站上?

我有一个问题想请教,我的网站现在是asp的,我已经把他生成了html的,正常我们访问 http://www.shwebc.com就是访问http://www.shwebc.com/index.html但我的网站里还有一个http://www.shwebc.com/index.asp,因为我的空间设置的是index.html高于index.asp,所以我想请问一下,GOOGLE是访问那个页面?谢谢

1. 谷歌对以文章名产生的URL可以识别, 无论它是那种语言.
2. 如果一个链接是错误的,谷歌最多是丢弃该链接, 不会对链接和被链接的网站的排名有任何惩罚.
3. 对example.com/index.html 和example.com/index.asp, 如果他们的内容是一样的, 谷歌会根据不同的情况收录其中某一页面.

谢谢谷海一粟

另外谷歌对网址的字母大小写是有区分的是吧?

发现网页设计上有一些小错误,造成了一个大写一个小写.
比如:http://www.whsjsoft.com/chinese/Bs_download.asp
http://www.whsjsoft.com/Chinese/Bs_download.asp

这两个网址其实是相同的,但是会在管理员工具中报告为重复的标题\重复的元标签.

我们已经修复了这些小问题,尽量的改进网站质量.不知道排名能不能再回来?

发表评论



Copyright © 2007 Google Inc. All rights reserved.
隐私政策 - 服务条款