众所周知,搜索引擎对重复内容是十分反感的,百度为了打击采集、伪原创出过很多次算法更新,深圳网站设计公司科慧设计为大家解析下常见的3点有关重复页面的问题。
Q:格式化数据微变,会不会被当作重复页?
比如一套房子有二十多条类似的属性数据,网站有十几万套房子数据,全部都用table标签布局显示。数据的内容大多是一些数字,文字比较少。它们的排版格式基本一样,只是数据的内容不同。请问这样的网页百度是否会当成雷同或重复页面拒绝收录呢?但实际上那些数据都是不一样的,都是有用的。
A:不会当做重复页面拒绝收录,可以识别的。虽然官方声明可以识别,但是作为站长也应该尽力差异化一下,否则可能会有不小比例的网页不被收录,当然原因可能不仅仅因为“内容重复"另外,运营网站本身就应该突出每个页面的主题,如果所有页面的主题都一样,那么用户在进入具体内容页之前看到各个页面的标题时也会产生疑惑。作为站长或SEO人员,应该抓住各页面间数据的不同,各页面上“独特的数据”也应该成为各页面的核心主题,站长或SEO人员可以这“独特的数据”为出发点,设法突出每个页面各自的“主题”,比如,把不同的数据直接体现在页面的Title. Description、 H1等重要标签和页面的重要位置,同时页面内容中也以设计围绕这个“独特的数据”推荐一些相同属性或其他方面相关的内容。如果只是为了差异化各个页面而随意在各个页面上随机调用了一些内容,那么搜索引擎也很难判断出各个页面主题和价值,从而无法给这些页面一个很好的搜索排序位置。
Q:很多行业网站特定页面几乎一致,会被认为SPAM(垃圾页面)吗?
我的站是一个钢材网站,钢材价格每天都会有些浮动,所以很多人搜索也会加上日期,比如×月×日钢材价格,于是我做了日期价格页面。问题来了,由于钢材每天的资源都差不多,唯一的变化是价格一点点地浮动,这点变化对整个页面微乎其微,远远不到百分之一,很容易造成重复页面,很多特殊的行业报价频道价格页面几乎一致,但是这样会不会被认为是SPAM页面?或者有什么好的解决方法吗?
A:某些页面是否重复或者是否为SPAM,是一个复杂的问题,搜索引擎也同样基于一系列复杂的策略做出应对,而不仅仅是依赖某个简单判断就下结论。具体到钢材的这个例子,还是那句我们反复强调的话--请替你的用户考虑,而不是替搜索引擎考虑--按日期拆成这么多页,相信还是出于搜索引擎优化的考虑多一些吧?对于用户体验来说,是否提供一个价格趋势图是更好的解决方案呢?与之类似,把一篇新闻拆成十几页固然可以让搜索引擎多收录几条,但对用户体验未尝不是一种伤害,而搜索引擎的终极目标是把对用户体验更好的页面排得更靠前。这之间的差别,希望能引发大家一些思考。
Q:关于重复页面的问题
百度如何面对很难处理的重复页面?比如,列表页有分页,文章页也有分页,它们的meta都是相同的,这样会不会被当重复页面处理?同时,比如一个论坛有两篇相同的帖子都被收录了,会影响先收录的帖子的排名吗?
A:(1)判定页面重复的算法很复杂。但可以肯定的是,仅meta相同,是不会被判为重复的
(2)相同的两个帖子被收录(URL可能不同),低权重的页面不会被建索引,或者被高权重页面类聚掉。
根据现在的情况来看,百度对文章的分页收录很不理想,在日志中鲜见百度抓取列表页的前几分页,据百度站长平台反馈,他们正在推出相关标签解决这个问题。