» 网友学堂 » Google优化 » 看我是怎么用WordPress消灭“补充材料”的
看我是怎么用WordPress消灭“补充材料”的
作者:ljjk5 发表时间:2007-11-12 16:25 阅读:116次 在百度搜索相关内容

我这个博客,你在Google里面输入:

site:sheawey.com *** -hhh

可以看到,几乎没有补充材料,我是怎么做到的呢?

(1)我这个博客3月底刚开始写的时候,由于外部链接的缺少,随着文章的增多,只要那篇文章不在首页有链接,就会直接进入“补充材料”,因此我在首页上“最新文章”选择了显示80篇文章,如下图:




具体操作手法是在模板的sidebar.php文件里面坐如下修改:




这样,很快那些文章就逃出了“补充材料”,其实道理很好理解,每个文章页在站点内获得了与首页一样多的链接,自然,不会因为链接的缺少而进入“补充材料”。

这个方法在网站刚开始,外部连接缺少的时候可以使用。随着文章的增多就有点影响站点形象了。

(2)多重的归档

这里所说的“归档”主要是指分类、月份归档、作者归档、网站地图、tag、相关文章之类的,因为这些“归档”是完全可以取得跟“首页”一样多的内部链接的,然后文章的链接由这些归档页传递,当然,“归档”种类越多,文章获得的链接就越多,(每文章平均获得的链接数/主页获得的链接数)这个百分比就越大。

这个话题要说起来太广泛了,你可以在实践中慢慢掌握,上面说到的一个内部链接的“数量概念”,还要注意一个“质量概念”,就是尽量在“归档”的时候考虑主题聚合的问题。

(3)分页问题

“归档”的时候,如果某个”归档”页内容比较多的时候,必然涉及到分页的问题。WordPress默认的分页是“上一页、下一页”这样的形式,这是一种链接的单项传递,链接结构是很差的,有人通过“[1][2][3]…[n]”这样的分页形式,这样从链接结构上是比“上一页、下一页”的形式要好。我们随便找两个博客看一下就知道了:

http://www.dunsh.org/
http://www.chinamyhosting.com/seoblog/
(“上一页、下一页”的形式)

http://www.kankanblog.com/
(“[1][2][3]…[n]”的形式)

可以看到,“上一页、下一页”的形式对于首页pr是4或者5他只能传递到2层,而“[1][2][3]…[n]”的形式却能传递到很多层,但一般不会超过10层。

我比较这两种分页导航形式,并不是要采用第二种,事实上,我一种也不采用。MT是seo做得比较好的博客系统,你去看一下他的结构,会发现:居然没有分页,不管首页还是“归档页”。

不过回过头来想想,确实也是,每个分页都是一样的title、meta属性,对于博客来说,是没必要分页的,所以我比较欣赏MT的做法。而在WordPress的博客中,形成Google“补充材料”的很大一部分是“分页”,但是Wordpress没办法后台设置或者模板修改让它不分页,这需要改动程序代码,方法如下:

打开wp-includes/query.php,找到995行

以下是原代码引用:
if
(
empty($q['nopaging']) && !$this->is_singular)
{
[复制到剪切板]


把它改为

以下是原代码引用:
if
(
empty($q['nopaging']) && !$this->is_singular && !$this->is_archive)
{
[复制到剪切板]


看一下,除了首页外,“归档页”全部不分页了。

至于首页的分页,你可以学MT把它从模板中去除,也可以直接在robots.txt中禁止抓取。

(4)文章长度问题

我的观察是每篇文章至少写个150字以上,当然,还跟你网页的“信噪比”有关。

关于长度问题、网页的“信噪比”可以参考我写的这两篇文章:

文章内容过短也可能形成Google的“补充材料”?

“补充材料”实验总结

(5)使用robots文件

某些实在不是很重要,如trackback、siteadmin之类的,找一下补充材料里面是否有不必要的网页,直接用robots禁止即可。

有些人认为feed会跟首页之间形成“复制网页”,因为他跟首页内容几乎类似,事实上没那么回事,在robots文件里面禁止了feed文件是个很麻烦的事情,rss类搜索引擎如feedburner之类的将不会索引你了,所以feed是不能禁止的。

(6)关于“转载”

据我一个月的观察,“转载”跟“补充材料”一点关系也没有,我的两个试验(看右边的sidebar放的页面链接):

简明 Python 中文教程 和 上海“希捷拓展”特色年会。

前者是从网上下载的电子书,直接ftp到网上,50%的页面逃出了“补充材料”,在我看来还是链接结构的问题,因为我是百分百“抄袭”,一点也没改。

后者是我替一朋友做的newsletter,他的这张网页被google索引了快半年了,我把一模一样的挂上去,照样没有被列入“补充材料”。

两个试验,一个是网上大量传播的电子书,一个是就跟一张网页“竞争”,都没事!

(说明:这个实验结束后,这些网页已经被我disallow了。)

总结

所以“补充材料”就是一个链接结构的问题,外部链接和内部链接结构的问题。我通过拿WordPress作为试验程序,描述了大体过程以及一些要领,主要启发思路,不可能面面俱到,比如url规范问题之类的就没说。

老实说,要把“补充材料”彻底消灭,是一种很“洁癖”的做法,一定量的补充材料存在是合理的,如果一个网站的内容结构如果不是实在太简单的话,有点“补充材料”看上去比较“健康”,只要不是绝大多数网页为“补充材料”,大可不必担心。这种“洁癖”玩法更多的是锻炼seo的基本功罢了。

#Advertisement