欢迎来到3C源码网
3C源码网

网站曾经收录的页面如今在哪里

日期: 2020-07-24 10:24:59

  最近速链吧的一个做新闻站的朋友遇到这样的问题:为什么我的网站百度收录的页面,过一阵就消失了?让他觉得很郁闷,好像“消失的子弹”一样!于是就问朋友,你的新闻是原创的吗?还是从别的网站抄的?朋友回答让人哭笑不得:肯定抄的啦,我哪有时间去找新闻题材啊!下面就朋友这一案例速链吧给大家分享一下为何网站收录的页面为何突然消失!

  这也是百度一个非常普遍的现象,跟百度对一个网站的考核有关。

  百度的大概工作流程是这关的,先把网址收录进数据库,这叫索引,说明网页的网址已经进入百度的待查看状态,这个时候,百度还没有看考察员――蜘蛛来爬取内容。

  重点来了,网址索引进数据库了,是按时间的先后来抓取内容吗?答案是:不是的。

  百度根据算法,会决定先爬行哪些网址。而百度索引这些网址的原因是,用来判断哪些网站的内容是先发表的,从而确定原创内容是出自哪个网站。

  因为信息量的巨大,把网址放进数据库,并按时间编号,可以做到非常好的实时性,但要对这些网址进行内容抓取,实时性差多了,所以索引时间作为判断原创内容的判断指标,而抓取的先后,即是根据这个网站以往的表现,即我们经常说的“权重值”这个权重值,是无法得知的,并非您现在能查到的权重值,这个评分是百度内部数据。百度先抓取“权重值”高的站的内容,然后抓取“权重值”低的站的内容。当二个不同网站,出现相同内容时,怎么判断内容是出自哪个网站的?

  这个时候就用到索引网址的时间来判断了,这样可以稍微分辨出原创内容,从而给原创内容的网站增加权重值,时间久了,原创网站就会有较好的排名。

  现在回来百度收录的页面,第二天就消失的情况,这个情形就是百度抓取了你站点的内容,但对比索引时间时,发现您的内容并非原创内容,而是复制别人的,所以百度第二天就把内容收起来了,把原创网站,或用户体验好的内容的内容呈现出来

  怎么样解决这个问题呢?

  解决这个问题就需要把我们的站点来到正常的优化的轨道上面来,需要加大我们的平时的优化的工作量。

  首先,内容方面就要有更多的原创的加入,最好是采用手写的方法来添加,因为这个原创度是非常的高的,很容易引起蜘蛛的不段的抓取,吸引更好的蜘蛛的到来。

  其次,除了内容就要对外链的权重加大,如果还是引用比较低的权重的外链很难吸引比较高质量的蜘蛛,所以我们就要在比较高权重的站点吸引蜘蛛的。

  总之,增加网站收录是一个长期的过程,会经过百度一段时间的审查和评价,网站seo优化的过程中切记不可操之过急,保持平常心,坚持下去就会有意想不到的效果。


上一篇:针对企业网站怎样进行优化

下一篇:为什么网站的url不宜使用中文