Categories


Tags


抓取异常的原因有哪些

一、网站异常

1、dns异常

当Baiduspider无法解析您网站的IP时,会出现DNS异常。可能是您的网站IP地址错误,或者域名服务商把Baiduspider封禁。请使用WHOIS或者host查询自己网站IP地址是否正确且可解析,如果不正确或无法解析,请与域名注册商联系,更新您的IP地址。

2、连接超时

抓取请求连接超时,可能原因服务器过载,网络不稳定

3、抓取超时

抓取请求连接建立后,下载页面速度过慢,导致超时,可能原因服务器过载,带宽不足

4、连接错误

无法连接或者连接建立后对方服务器拒绝

二、链接异常

1、访问被拒绝

爬虫发起抓取,httpcode返回码是403

2、找不到页面

爬虫发起抓取,httpcode返回码是404

3、服务器错误

爬虫发起抓取,httpcode返回码是5XX

4、其他错误

爬虫发起抓取,httpcode返回码是4XX,不包括403和404

来源:百度搜索资源平台 百度搜索学堂


Public @ 2018-09-22 16:02:23

百度搜索资源平台-站点Logo权益获取与使用说明

1、什么是站点Logo?站点Logo是在百度搜索网站名称时,出现在网站名称下方的Logo标识,有利于增强站点曝光,更好地吸引搜索用户。PC端和移动端的展现略有不同,详见以下两个示例。移动端站点Logo前端展现示例:PC端站点Logo前端展现示例:2、如何优先获得站点Logo权益?报名通道:填写《搜索权益获取》问卷 。满足以下条件可优先获得站点Logo权益:站点关联智能小程序,成功生效至少一条替换规

Public @ 2020-08-22 15:35:36

百度搜索资源平台sitemap提交后状态总为等待该怎么办?

如果您在百度搜索资源平台提交了Sitemap后,状态总是显示为等待,您可以按照以下步骤进行排查和解决: 1. 确认Sitemap的格式和内容是否符合规范,是否存在错误或重复等问题; 2. 检查Sitemap的URL是否可以被访问,是否存在网络或服务器问题; 3. 确认Sitemap的更新频率和页面变化情况是否适当,不要频繁变更或提交Sitemap; 4. 等待一段时间后重新提交Sitemap,或

Public @ 2023-04-06 08:50:10

百度站内搜索服务协议

发布日期:2015-06-01服务内容:利用百度的搜索引擎技术,帮助站点面向其用户提供站内搜索服务。为此,站长需要将百度提供的代码按照要求部署到自己的站点上,用户在这段代码对应的搜索框里输入关键词,百度返回与相应关键词相匹配的该站点结果。站长可以主动提交本站数据以用作搜索备选集合,也可以选择直接搜索百度已经抓取的本站数据,两种数据只能任选其一。站长对于主动提交的数据须保证数据的真实性、完整性及合法

Public @ 2014-08-18 16:07:10

智能小程序蓝军用户火爆招募中!五大收益等你来拿!

听说你能力出众,各种玩法信手拈来,但苦于没有地方能分享一二?听说你每日勤恳,基础操作烂熟于心,但苦于没有地方能交流提升?听说你逻辑过人,产品建议合理完善,但苦于没有更好的渠道反馈?现在,有一个让你能够让你发挥才华,交流提升,甚至辅助产品决策的组织来了——智能小程序平台蓝军用户。作为蓝军用户,你会与平台一同成长。能够自由的与其它用户交流分享经验,共同研究更好的智能小程序运营策略;你的问题和建议也能够

Public @ 2009-04-20 16:01:57

更多您感兴趣的搜索

0.557600s