为了对网站进行搜索引擎优化,专业的SEO都会强烈建议将动态的网页转变成静态的网页,将网页静态化确实是一个很好的优化策略。目前网页优化策略中的静态网页分真静态网页和伪静态网页两种,关于伪静态网页和生成方法在这之前我们有探讨,今天那个重点探讨SEO网站优化之生成真静态网页的利与弊。相对于Wordpress等程序的伪静态URL重写,Z-Blog的真静态更有优势,搜索引擎蜘蛛会喜欢能响应If-modified-Since header和正确返回304(文件未更新)的服务器,而只有html真静态文件能默认做到这一点,搜索引擎可以正确判断文件是否更新及更新时间,并且减少重复抓取的损耗。这点也可以加快客户端载入网页的速度,CSS和JS等文件通常只需传送一次即可。访问多个网页时可有效提高用户体验。
1、访问速度相对比动态网页快。
在数据量相当的情况下,静态网页的下载速度要比动态网页快。这无论对于用户还是搜索引擎机器人都是非常友好的表现。特别是你的站点流量非常大,数据量也非常大,这时网页的下载速度对于你的网站来说是非常重要的。
2、网页的可控制性增强,网页的相似度降低。
在将网页静态化的过程中,一般会设计这样的功能。就是可以手动输入要生成静态网页的名称。这对于搜索优化比较有益处。比如笔者做WebCEO下载时,选取的文件名为:webceo-download。在Google中搜索“webceo 下载”时排名第三。你可以去看去观察一下,在搜索结果中的前三位,都在URL中出现了WebCEO,并且Google也把它加粗了。可见Google还是要考虑这一点的。而动态网页在未经过处理的情况下,它的文件名一般会是这样"Download.aspx?ID=123"。这样的文件名肯定就没有前面的文件名好了。
同样,对于Title、Keyword和Description等HTML标签,我们同样可以做成可手动控制的。通过增加这些网页元素的可控制性,我们可以降低网页的相似性,搜索引擎也会收录更多的网页。将网页静态化确实具有一定的优势,但经过实践,笔者也发现并不是说将网页静态化就是百分之百的好事。不过笔者在这里也想提醒您,是否要实施网页静态化得视具体的环境而定。如果应用不恰当,不但达不到优化的效果,还有可能给您带来很大的麻烦。
1、生成静态网页会增加服务器空间的负担。
有人是这样估算的:一篇文章的内容大概会占5K-10K,而其他的代码会占2/5-4/5,一个文件大概会增加15K左右,对于30万的文章数据库来说,需要增加了3.6G的硬盘空间使用。虽然现在的硬盘容量越来越大,但当网站的数据量达到一定的程度后,就得考虑这方面的因素了。
2、大量的静态网页增加维护的工作量。
网站的更新改版是免不了的事。你可以试想一个有一万个网页的网站(并不是特别多)要在每个网页增加一些内容,这将会是一件非常麻烦的事情。当然你也许会说我程序写好一点,更新就会很方便。笔者承认编写优质高效的程序可以减少这样的工作量。但是没法彻底解决大量文件带来的麻烦。
比如,很多静态化的网站都会有一个批量更新的功能。也就是批量生成静态网页。其实,这样的功能设计是很好的,但是在实际的使用中会出现一些问题。笔者遇到的最大问题是由于各种软硬件原因,在数以万计的网页文件中,总是有极少数文件没有生成成功,更糟糕的是有些没生成成功的文件无法被记录下来。这就好比一颗“定时炸弹”,它总有一天会“爆炸”。它始终是会被用户或蜘蛛找到,然后发现:咦,这个网页是咋回事呀?不对呀!
3、生成的静态网页消耗服务器资源。
有很多开发者将生成的静态网页的功能是用线程完成的。当文件数量大时,这会很耗服务器资源。
4、静态网页要读取动态数据。
你可能已经发现很多生成的静态网页是可以读取到系统的最新动态的。比如系统最新的想新闻。这其实就是一个静态网页要实现动态读取数据的功能。这在技术上是可以实现的,并且实现的方法很多。但在你设计网站的时候,就得考虑到这点。
可见,将网页静态化或者动态化都有一定的优势和不足。现在有一种做法就是将静态网页伪静态化。采用的是URL Rewrite,就是将动态的URL重写,形成静态页的表象。这也算是可以这两种方式的优势互补吧。
1、访问速度相对比动态网页快。
在数据量相当的情况下,静态网页的下载速度要比动态网页快。这无论对于用户还是搜索引擎机器人都是非常友好的表现。特别是你的站点流量非常大,数据量也非常大,这时网页的下载速度对于你的网站来说是非常重要的。
2、网页的可控制性增强,网页的相似度降低。
在将网页静态化的过程中,一般会设计这样的功能。就是可以手动输入要生成静态网页的名称。这对于搜索优化比较有益处。比如笔者做WebCEO下载时,选取的文件名为:webceo-download。在Google中搜索“webceo 下载”时排名第三。你可以去看去观察一下,在搜索结果中的前三位,都在URL中出现了WebCEO,并且Google也把它加粗了。可见Google还是要考虑这一点的。而动态网页在未经过处理的情况下,它的文件名一般会是这样"Download.aspx?ID=123"。这样的文件名肯定就没有前面的文件名好了。
同样,对于Title、Keyword和Description等HTML标签,我们同样可以做成可手动控制的。通过增加这些网页元素的可控制性,我们可以降低网页的相似性,搜索引擎也会收录更多的网页。将网页静态化确实具有一定的优势,但经过实践,笔者也发现并不是说将网页静态化就是百分之百的好事。不过笔者在这里也想提醒您,是否要实施网页静态化得视具体的环境而定。如果应用不恰当,不但达不到优化的效果,还有可能给您带来很大的麻烦。
1、生成静态网页会增加服务器空间的负担。
有人是这样估算的:一篇文章的内容大概会占5K-10K,而其他的代码会占2/5-4/5,一个文件大概会增加15K左右,对于30万的文章数据库来说,需要增加了3.6G的硬盘空间使用。虽然现在的硬盘容量越来越大,但当网站的数据量达到一定的程度后,就得考虑这方面的因素了。
2、大量的静态网页增加维护的工作量。
网站的更新改版是免不了的事。你可以试想一个有一万个网页的网站(并不是特别多)要在每个网页增加一些内容,这将会是一件非常麻烦的事情。当然你也许会说我程序写好一点,更新就会很方便。笔者承认编写优质高效的程序可以减少这样的工作量。但是没法彻底解决大量文件带来的麻烦。
比如,很多静态化的网站都会有一个批量更新的功能。也就是批量生成静态网页。其实,这样的功能设计是很好的,但是在实际的使用中会出现一些问题。笔者遇到的最大问题是由于各种软硬件原因,在数以万计的网页文件中,总是有极少数文件没有生成成功,更糟糕的是有些没生成成功的文件无法被记录下来。这就好比一颗“定时炸弹”,它总有一天会“爆炸”。它始终是会被用户或蜘蛛找到,然后发现:咦,这个网页是咋回事呀?不对呀!
3、生成的静态网页消耗服务器资源。
有很多开发者将生成的静态网页的功能是用线程完成的。当文件数量大时,这会很耗服务器资源。
4、静态网页要读取动态数据。
你可能已经发现很多生成的静态网页是可以读取到系统的最新动态的。比如系统最新的想新闻。这其实就是一个静态网页要实现动态读取数据的功能。这在技术上是可以实现的,并且实现的方法很多。但在你设计网站的时候,就得考虑到这点。
可见,将网页静态化或者动态化都有一定的优势和不足。现在有一种做法就是将静态网页伪静态化。采用的是URL Rewrite,就是将动态的URL重写,形成静态页的表象。这也算是可以这两种方式的优势互补吧。