Categories


Tags


新浪死链处理经验分享

在第四次深“度”接触结束后,spider工程师表示新浪的死链处理工作一直效果不错,提醒学堂应该请其做个分享。新浪稳座国家级门户头把交椅,谁还敢说自己网站结构的复杂程度可以超越新浪。于是我们请王久明分享一下新浪在死链处理和死链预防(重要页面因修改而产生死链)方面的经验。

一、在以下背景下会较多产生死链:

1、时政新闻的敏感性;

2、来自监管的删除需求;

3、频道(编辑)自身删改的需求;

4、搜索方期望资源方主动优化和定期清除的需求

二、死链分类:

由于系统架构、历史遗留问题、多业务系统交叉影响等多方面因素,新浪存在如下三种死链:

1、协议死链,服务器端返回HTTP状态码404;

例如:‘谁在伪善’http://news.sina.com.cn/movie/music/1999-06-15/2965.shtml

2,内容死链,服务器端返回HTTP状态码200,无法设置为404;

例如:http://news.sina.com.cn/c/2015-04-23/184531753084.shtml

3,页面需要用户和蜘蛛可以正常访问,但由于删改或误操作导致反复上下线形成协议死链或内容死链。例如:http://news.sina.com.cn/2015-12-05/doc-ifxmhqaa9933763.shtml

上线后又下线,后又上线,甚至反复多次。由于下线期间存在协议死链或内容死链的情况,导致百度认为该页面应该被删除,不被收录,且即使后续重新上线也无法恢复收录。对于这种情况,应加以预防。

三、解决方案:

1、协议死链,这个最符合HTML标准处理方式,站点方面无须多做什么,如果需要百度快速处理可以通过百度站长平台的死链提交工具(/college/courseinfo?id=267&page=4#h2_article_title18)进行主动提交

2,无法设置协议死链接,仅主体内容文本被删除的内容死链死链,新浪的处理方法是:

1)走事先之制定好的《死链标准流程》:用站内标准内容死链模板页面(告诉用户该页无法找到)覆盖需要删除的页面,5秒后跳转到统一的全站导航页,以减少用户流失。

2)根据需要,比如根据特定关键词圈定一批最终需要处理为协议死链的敏感页面,将这些页面链接放到一个文件里,由专人在服务器端修改成协议死链。通过百度站长平台工具进行死链提交

3,针对反复上下线导致百度误判为死链的情况,新浪的预防办法是:

1)制度上:系统后台设置提醒,提醒编辑上线后除非特殊情况不要下线;

2)功能上:这种情况在专题运营中最常见,且影响比单篇新闻页要大,由于我站点运营规定是不能删除页面的,因此在系统后台将“删除专题(对编辑来说就是删除该专题)”和“将专题调整为不对外显示(对编辑来说不是删除,而是暂时下线,调整为外网用户无法访问,可随时再次重新上线)”两个功能严格区分开,并提供回收功能。针对“将专题调整为不对外显示”这种情况,不再将页面更新为内容死链(页面无法找到),以免被百度误判。专题页面仍可访问,只是站点不设置入口、不进行推广,用户没有访问来源而已。

来源:百度搜索资源平台 百度搜索学堂


Public @ 2013-02-21 15:36:49

网站被惩罚之后如何处理

网站被惩罚几乎是一个网站运营的必经过程。不要太紧张,首先要查明网站被惩罚的原因,然后分析原因并找出解决方法,处理方法常见如下:1、用site指令査看网站是否是全站被搜索引擎删除还是少量关键词下降有的时候并不是你网站自身问题,搜索引擎经常会出现很多意想不到的问题。用site指令查看之后如果你的网站还在,可放心继续做好日常维护工作;如果没有页面表明网站已经被搜索引擎从数据库中删除了,赶紧查找原因。2、

Public @ 2009-04-23 15:38:13

及时处理死链可以给站长带来什么

当网站死链数据累积过多时,并且被展示到搜索结果页中,对网站本身的访问体验和用户转化都起到了负面影响。另一方面,百度检查死链的流程也会为网站带来额外负担,影响网站其他正常页面的抓取和索引。优化用户体验:减少死链对网站品牌的损伤和用户的差评度改善网站排名:减少死链对线上搜索排名的负面影响增加网站收录:提交死链列表后,增加网站内容的收录几率提升网站流量:排名和收录改善后,间接提升网站流量来源:百度搜索资

Public @ 2014-04-28 15:36:50

百度搜索建议的死链设置方案

第一步,将返回码设置为404或者410:如果站点/小程序已永久删除相应内容,并且不打算对内容进行替换,建议开发者将返回码设置成404或410,百度爬虫尝试抓取网页时,如果返回码为404或410,会将URL判定为死链,进而从搜索中删除第二步,设置完返回码后,修改页面标题,明确表示该页面为死链,页面内容可以进行个性化设置。对百度搜索不友好的死链类型及不推荐的死链方案:1、个性化死链部分开发者追求个性化

Public @ 2013-12-22 15:36:55

死链对网站的影响

用户体验感:换位思考,当我们满怀期待地打开一个网址,收到的反馈确是”您访问的网址无效“或者”页面不存在“的结果,大部分用户都会直接关掉走人,而如果多次出现这种情况,则不仅会造成流量的流失也接对网站的信用产生了影响。耗费资源:搜索引擎爬虫在抓取网站的页面时不仅要耗费搜索引擎自己服务器的资源,也会对网站的服务器造成压力,而死链无论是对于搜索引擎还是网站本身,都是一场空,是在浪费资源。影响网站排名:搜索

Public @ 2017-10-30 15:56:19

更多您感兴趣的搜索

0.522180s