网站的URL标准化(URL canonicalization):
简单的说就是让搜索引擎挑选最好的URL做为你的首选网址,集中权重。
很多人也许都没听说这个词。我们用具体的例子来帮你解释这个词
我们先看一下下面几个URL:
http://www.33230.com
http://33230.com
http://33230.com/index.php
http://www.3230.com/index.php
当你打开以上几个连接到达的都会是同一个页面,但是从技术上来讲,这几个URL网址都是不同的,
当搜索引擎要规范化网址时,搜索引擎需要从这些选择当中挑一个最好的代表。一般来说,你的主
页应该是固定的,只有一个。但是有的时候,在很多网站上站长在链接回主页时,所使用的URL并
不是唯一的。比如很可能在你的网站上,
一会连到URL http://www.33230.com,
一会儿连到URL http://www.33230.com/index.php 。
我们这里强调的是“不管你决定要对应哪一个URL,请一定一直就只对应这一个URL。”
这些网址都能访问,也不会给访客造成麻烦,但是对搜索引擎来说他不清楚,哪一个网址是你真正
的主页呢?如果在你的网站上,不同的版本网址都大量出现,那么这两个URL可能都会被搜索引擎
收录进数据库,这时就会造成复制内容网页。
所谓复制内容网页,指的是两个或多个网页的内容是相同或大部分相似的。很多时候,复制网页有
可能是作弊手段。就算不是作弊手段的时候,搜索引擎通常也只会挑出其中一个返回搜索结果,而
把其他的复制网页都排在最后面,以至于根本找不到。当你的网站出现网址URL规范化问题的时候,
就有可能造成被怀疑为复制网页,因而影响搜索引擎结果排名。
我们可能通过以下三种方法制定网站的URL标准化:
1)你的网站内部在链接到其他网页,尤其是主页时,只使用一种URL。不管是包含www或不包含
www,你要由始至终只使用一个版本。这样搜索引擎也就明白哪一个是规范化的主页网址。
2)使用301重定向,在你的主机服务器上,把所有有可能成为主页网址的URL,到你所选择的主页
网址版本。
3) 使用基准标签base 在网页的head区加上
当然,除了包含www和不包含www的两个版本以外,还有其他类型的URL规范化问题。比如有的时
候,搜索引擎会去掉或加上网址尾端最后的斜线。有的时候会尝试把大写字母换成小写字母,有的时
候可能尝试去掉会话ID(session ID)等等,这些都有可能造成网址规范化问题。
注意:
1、对于首页,一般选择带www的域名作为唯一URL。(首页的URL,搜索引擎称为首选域)
2、一级目录时,一般直接用目录形式,而不带index.html等。
Leave a Reply
XHTML: You can use these tags: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

六月 26th, 2010 at 13:34
[...] 通过301的重定向我们可以更好的URL网址标准化,武汉SEO在学习SEO过程中给大家整理了网上的一些301重定向方法,希望对大家有用。 [...]
六月 26th, 2010 at 14:05
[...] 中午吃饭之前发了一篇名为:学习:URL标准化 过了30分钟百度收录了!而且放出来了! [...]
六月 28th, 2010 at 17:12
[...] 6.26号:发了一篇:学习:URL标准化 百度神奇的收录了!完了又放出来! [...]