Categories


Tags


页面无用时间信息导致网页不被抓取

在第一期【院长帮帮忙】栏目露面的站点是编织汇(www.bianzhihui.com),该站点通过反馈中心反馈页面内容迟迟不被抓取,经百度工程师追查,原来是因为页面上的无用时间信息——没有想到是不是?同学们快来看看这个案例吧。也想让院长帮助追查吗?快来看看这里!

站点求助:现象

编织汇网站内容发布后几个礼拜都未曾收录。案例如下:

http://www.bianzhihui.com/t/6717(教程详细页面举例)

http://www.bianzhihui.com/u/12306 (用户页面举例)

http://www.bianzhihui.com/h/154 (编织花样页面举例)

我们已将这些url放入sitemap,并使用了百度统计的集成的JS推荐,但是未曾有改善。

站点求助:自查

根据反馈中心的回复,使用抓取异常工具诊断:未发现异常

院长出手,内部追查

工程师结论: spider抓取很及时,但因为该网站没有设置内容产出时间,网站底部却有个老旧时间日期,导致spider误以为网页内容老旧(具体策略较复杂,在此不做赘述)。建议增加页面内容产生时间,去掉没有必要的时间信息

*以上为旧页面截图,“2014年9月9日”对时间识别造成干扰。

站点总结:

1,网页上切忌勿乱加时间,如我们网站的(始于2014年9月9日)这种时间是一个大忌

2,网页内容尽可能加上产出时间,也就是发布时间

3,百度site的结果时间和权重并无太多关系

4,跟百度沟通的时候,一定要条例清晰,证据确凿。自身的问题一定要先排查准确。

【院长帮帮忙】第二期:服务器限制外网访问造成主动推送失败

【院长帮帮忙】第三期:无效搜索结果页是个祸害

【院长帮帮忙】第四期:URL构成越简单越平常越好

来源:百度搜索资源平台 百度搜索学堂


Public @ 2014-01-01 15:22:05

常见的死链返回码

404 Not Found,表示服务器没有找到任何匹配请求URL的东西,没有说明这种情况是暂时的还是永久的。410 Gone,表示请求的内容在服务器上不再可用,且没有已知的转发地址。410通常表示资源永久性的失效。正常页面返回码:200 OK,表示请求成功。如果相关内容已删除或移动,不建议返回成功状态码(200 OK)而是返回404、410状态码。204 No Content,表示这个请求没有要发

Public @ 2016-11-27 15:36:54

HTTPS究竟是啥?这篇文章带你快速了解HTTPS

HTTPS(Hyper Text Transfer Protocol Secure),是HTTP协议的安全版本。相比传统的HTTP协议,HTTPS除了具有HTTP协议的传输功能,还加入了SSL/TLS协议,以提供网站服务器与客户端之间的机密传输、数据完整性以及防止网站遭到篡改的能力。 HTTPS的安全性得益于SSL/TLS协议,SSL/TLS协议是一种加密技术,通过使用加密处理密钥来为浏览器

Public @ 2023-03-01 04:00:32

【院长帮帮忙】移动适配不稳定、不生效,可能是这些原因造成的!(第五期)

1. 平台兼容性问题:不同移动设备或操作系统的适配方式可能不同,需要适配的平台越多,问题也就越多。解决方案是在开发前进行充分的市场调研和测试,确保在主流平台上的适配稳定生效。 2. 分辨率适配问题:不同移动设备的屏幕分辨率不同,可能导致界面显示异常或排版错乱。解决方案是通过媒体查询、百分比布局等技术手段,使页面能够根据不同分辨率自动适配。 3. 浏览器兼容性问题:不同浏览器对于HTML、CSS

Public @ 2023-07-27 10:00:35

【院长帮帮忙】我的网站排名为什么突然下降?(第十期)

可能有多种原因导致您网站排名突然下降,以下是一些可能的原因及解决方法: 1. 竞争对手优化反击:您的竞争对手执行了更好的搜索引擎优化策略,导致他们的网站排名上升,您的网站排名下降。 解决方法:通过了解您的竞争对手的优化策略,制定更好的策略,例如添加更好的关键词、更好的网站内容以及实施更专业的SEO技巧。 2. 网站内容更新不及时或质量下降:搜索引擎对网站内容有一定的要求,如果您的网站缺乏新的

Public @ 2023-06-03 06:00:25

更多您感兴趣的搜索

0.582770s