[转载]关于网页静态化及SEO问题的一些补充-Mikel

[转载]关于网页*静态化*及SEO问题的一些补充 – 老赵点滴 – 追求编程之美 – 博客园.

前一篇讨论“静态页”的文章反响不错，不少朋友发表了自己的看法，也给老赵更多的想法。虽然也在前一篇文章后面回复了不少内容，但是就以往经验来看，总结为一篇新的文章会让我想表达的内容更为明确，对于“静态化”这一非常容易被人误解的概念来说也是非常重要的。

我们还是先来讨论一下，什么叫做“静态页”。有朋友说，放在硬盘上的htm或html文件便是一种静态页，Web服务器不需要做额外的处理，直接读取文件内容并输出就可以了，而这样的静态文件对于SEO是有帮助的。至于理由，是搜索引擎会对html结尾的文件给更好的权值（这好像还是结论，不是理由），而这是“常识”，“了解一点SEO的人都知道这个”，“人们普遍在使用的做法”，因此“它一定是正确的”。不过其实Google并不这么认为，百度倒没有给出专业说法。

当然，我们已经重复强调，但还是需要不断明确的一点是，即使搜索引擎对于“静态页”有更好的倾向性，那也是因为其“URL样式”，而不是“在硬盘上放置了一个html文件”。请求方（也就是爬虫）只是向服务器端发送一个URL，并获取服务器端给出的内容。它不会关心，也无法了解服务器端究竟是如何得到页面内容的，对于客户端来说，世界上没有“静态”或“动态”页面之分。有些朋友可能还是会说“不会啊，html就是静态页面，像aspx之类的就是动态页面，前者不需要在Web服务器上运算，后者需要”。

真是这样的吗？并非如此，因为html文件也是需要Web服务器来运算的。例如，您请求一个html文件，Web服务器至少做了几件事情：

如果请求包含缓存信息，那么处理缓存状态。
根据URL定位到磁盘上的文件。
进行用户认证和授权（如，是否匿名？）。
判断是否有权限读取。
读取文件。
根据文件类型设置MIME的值。
根据文件最后修改日期设置Last-Modified值。
根据文件内容及其他状态设置其E-Tag值。
如果文件内部有include标记，那么读取另一个文件填充进来。

看看，处理一个文件需要多少“动态运算”啊，这些可都是在Web服务器（如IIS）加载一个html所做的事情。如果您想要观察这些过程，可以阅读一些 Web服务器的源代码，或者去观察一下ASP.NET中System.Web.StaticFileHandler类所做的事情，它也体现了Web服务器处理html时的关键之处。事实上，如果您在IIS中将html配置给ASP.NET ISAPI的话，或者使用VS自带的Web服务器，最后便是由StaticFileHandler来输出硬盘上的文件的。

所以，虽然我们看起来Web服务器只是简单地读取了硬盘上的文件，但其实它还是不如我们想象的那么简单。不过对于客户端来说，这一切都是不可知的。例如 Squid，Nginx这样部署在前端的缓存或反向代理服务器，它们都不会关心后端Web服务器是Windows，Linux还是Unix，也不会关心是 IIS，Apache，Lightted甚至是我们自己写的高效或低劣的Web服务器。对于浏览器，爬虫，或前端负载均衡器来说，它们只知道TCP/IP 协议，它们只知道HTTP协议等东西，其他一概不知。

不过，也有朋友坚持认为“生成静态页”来“进行页面缓存”对SEO有帮助。理由是， “进行页面缓存”能够提高网站性能，爬虫更倾向于访问速度更快的页面。从这个角度看来，这种说法的确有一定道理。只是我还是不喜欢这样的看法，因为这种说法没有把握事物关键。在这里，SEO的关键在于优化网站性能，而生成静态页只是一种手段之一。这并不是适用性最广的，也并非是最容易实现的。如果您直接把 “生成静态页”与“SEO”联系起来，很有可能会对他人造成误解。

当然，如果您的思路没有问题，“静态页”三个字的指代也足够明确，“静态页有利于SEO”这个命题毫无疑问是正确的。不过我们现在并没有讨论一个命题的逻辑是否正确，我们也不必纠缠于一个表达形式是否严谨，我们的目的是要说明道理。也正因为如此，老赵才会一遍一遍地写这么多内容。也就是说，这几篇文章的关键在于“说清道理”，我们把握它既可。

最后，老赵再谈一下对SEO这个工作的看法。

从老赵与各SEO人员的接触感觉来看，他们总是有各种理由来说明“问题所在”，只是如果在改进问题之后还是没有效果的话，他们又可以找出各种理由来告诉你为什么没有效果——但是要知道SEO是一个实践性工作，它的唯一判断依据便是“效果”，而不是“理论”。SEO的理论很容易掌握，但是如果无法真切提高一个网站在搜索引擎上的表现，这一切还是白搭。老赵认为，一个好的SEO是需要了解网页制作，或者说网站开发的基本技术的，至少要有常识，否则基本上就是在扯蛋。老赵曾经接触过一个“专业”的SEO公司，那里的“SEO咨询师”给我留下了深刻的印象——负面印象。其“非专业性”从以下几个事件中便可见一斑：

还是“静态页”的问题。由于把URL变为.html结尾之后并没有得到明显的效果，他询问我们的实现方式。在得知我们使用了URL重写，而不是在硬盘上放置 html文件时他“惊呼”这种欺骗搜索引擎的行为是会起到反效果的。他强烈要求我们在硬盘上放置html文件。这个要求自然遭到了我们的拒绝，原因之一是我们是非常动态的网站，很难实现这个需求，但是更重要的是，懂得一点技术的人就知道，Web服务器的处理方式对于搜索引擎爬虫时完全不可见的，我们是否真正放置html文件与搜索引擎没有任何关系。
内容的位置问题。在SEO界有种说法是，搜索引擎会更倾向于把页面靠前的内容看的更重，而把页面靠后的内容权值放低。因此那位专业SEO咨询师指着我们的某张页面说，这部分内容太靠“下方”，很容易被搜索引擎忽略。请注意，他说的是“内容在页面显示的时候出现在下方”。您觉得这种说法有道理吗？如今页面布局往往使用XHTML+CSS的方式，而搜索引擎只会关注HTML的内容，而“位置”很大程度上是由CSS，甚至是由JS来控制的。出现在HTML内容前段的内容，在页面呈现时也可以出现在下方，这也和搜索引擎没有任何关系。可惜这一点也解释了半天。
最后一条可以说是最可笑的。因为SEO效果不好，那位SEO咨询师觉得只能“来真的”了，于是向我们索要网站的 IIS日志。分析日志对于SEO有些帮助，因为可以看出爬虫的抓取顺序，频率，甚至结果等等，因此查看日志的做法本没有问题。可惜问题在于，对方从MSN 上给出一个邮箱，让我们把过去几个星期的日志发给他。当看到这个要求的时候，老赵几乎要破口大骂。从这点可以看出，这位SEO咨询师缺少必要的常识，他根本不知道一个中小型的网站，每天便要生成几百兆到几个G的日志。如此没有常识，为什么会有那么多“成功案例”？

老赵的博客（也就是您正在看的这个）在搜索引擎上的表现也非常糟糕，即使是老赵经常写作的话题，在Google上也很难找到几篇文章，排名也不太靠前。如果不使用 site:cnblogs.com进行限制的话，几乎没有一篇文章是找到我的blog，都是各种地方的转载。为此我也比较苦恼，咨询了一些专业搞SEO的朋友，做出一些修改之后还是没有太大改善。不过我相信那只是我没有遇上优秀的SEO人员而已，我的博客的潜力还远没有挖掘到底。

如果您是一个专业的SEO人员，或者是专业的SEO公司，不妨给我一些建议——如果可以的话，我也不介意在这方面进行一点投资。不过，如果是一些“肮脏”的优化方式就不必了，例如去论坛上贴链接，发垃圾邮件。我也知道这些做法很有效果，但是我不想这样做。

[转载]关于网页静态化及SEO问题的一些补充

相关推荐

热门标签

分类

链接表

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏