Categories


Tags


页面无用时间信息导致网页不被抓取

在第一期【院长帮帮忙】栏目露面的站点是编织汇(www.bianzhihui.com),该站点通过反馈中心反馈页面内容迟迟不被抓取,经百度工程师追查,原来是因为页面上的无用时间信息——没有想到是不是?同学们快来看看这个案例吧。也想让院长帮助追查吗?快来看看这里!

站点求助:现象

编织汇网站内容发布后几个礼拜都未曾收录。案例如下:

http://www.bianzhihui.com/t/6717(教程详细页面举例)

http://www.bianzhihui.com/u/12306 (用户页面举例)

http://www.bianzhihui.com/h/154 (编织花样页面举例)

我们已将这些url放入sitemap,并使用了百度统计的集成的JS推荐,但是未曾有改善。

站点求助:自查

根据反馈中心的回复,使用抓取异常工具诊断:未发现异常

院长出手,内部追查

工程师结论: spider抓取很及时,但因为该网站没有设置内容产出时间,网站底部却有个老旧时间日期,导致spider误以为网页内容老旧(具体策略较复杂,在此不做赘述)。建议增加页面内容产生时间,去掉没有必要的时间信息

*以上为旧页面截图,“2014年9月9日”对时间识别造成干扰。

站点总结:

1,网页上切忌勿乱加时间,如我们网站的(始于2014年9月9日)这种时间是一个大忌

2,网页内容尽可能加上产出时间,也就是发布时间

3,百度site的结果时间和权重并无太多关系

4,跟百度沟通的时候,一定要条例清晰,证据确凿。自身的问题一定要先排查准确。

【院长帮帮忙】第二期:服务器限制外网访问造成主动推送失败

【院长帮帮忙】第三期:无效搜索结果页是个祸害

【院长帮帮忙】第四期:URL构成越简单越平常越好

来源:百度搜索资源平台 百度搜索学堂


Public @ 2014-01-01 15:22:05

网站安全风险及应对方案

网站安全风险包括以下几个方面: 1. 网络攻击风险:包括黑客攻击、DDoS攻击、SQL注入攻击、跨站脚本攻击等。 2. 恶意软件风险:包括病毒、木马、恶意广告等。 3. 数据泄露风险:包括账号密码泄露、个人隐私泄露等。 4. 网站服务可用性风险:包括服务器宕机、网站崩溃等。 针对上述风险,可以采取以下措施进行应对: 1. 防范网络攻击:采用防火墙、安全认证协议、访问控制等技术手段,来防

Public @ 2023-06-26 11:50:35

HTTPS的收录机制是什么?

HTTPS(全称为Hypertext Transfer Protocol Secure)是一种安全的、基于HTTP的传输协议,主要用于用户与网站之间传输数据或进行安全登录等操作。HTTPS 的收录机制主要是利用 HTTPS 协议,将网页内容加密传输,搜索引擎就能索引到 HTTPS 站点的网页链接信息;而当爬虫抓取数据时,它会进行浏览器模拟从而获取网页信息。

Public @ 2023-03-01 06:00:13

【院长帮帮忙】我的网站排名为什么突然下降?(第十期)

这可能有多种原因。首先,你的网站可能是被别的网站抢占了搜索引擎的排名名次。这样会导致你的网站降下来。其次,你可能遭到了网络攻击,病毒或者反爬虫等恶意攻击,这会影响你网站的表现。此外,如果你的网站更新不及时或者没有及时维护,搜索引擎会认为你的网站内容不新,因此会把你网站降低排名。

Public @ 2023-03-03 05:00:10

【院长帮帮忙】流量断崖式下跌,如何自查恢复?(第七期)

院长近期收到一个VIP站点反馈,站点下的所有收录都没有了,站点流量断崖式下跌,先来看看这扎心的图:PC端流量变化:移动流量变化:院长解答:出现这种情况,首先要站长观察流量下滑期间站点是否有异常,并自查以下步骤:1. 网站自查发现自己出现过服务器异常,服务器错误导致页面失效,需尽快恢复站点服务器;这里推荐使用站长平台“抓取异常工具”&“抓取诊断工具”,可整体统计站点近期抓取问题,模拟蜘蛛抓取

Public @ 2014-02-02 15:22:05

更多您感兴趣的搜索

0.418676s