Categories


Tags


网站日志在哪里?如何下载日志?

网站日志是做SEO时网站管理员和搜索引擎对话沟通的途径。通过日志,了解搜索引擎蜘蛛的访问情况。在很多时间,我们需要查看网站日志。以获得了解搜索引擎如何爬取咱们的网站。

如何下载日志

通过FTP访问网站的根目录。可以看到一个包含log的文件夹,这是存放日志的地方。

微信图片_20181108173907.

如何查看日志

下载、解压、打开日志文件,日志文件内容如:

61.135.168.22 - - [11/Jan/2009:04:02:45 +0800] "GET /bbs/thread-7303-1-1.html HTTP/1.1" 200 8450 "-" "Baiduspider+(+http://www.baidu.com/search/spider.htm)" (注:百度,这部分为本文添加)

203.208.60.43 - - [11/Jan/2009:04:02:43 +0800] "GET /sns/space-13563-do-friend-view-me.html HTTP/1.1" 200 5162 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" (注:Google)

202.160.178.21 - - [11/Jan/2009:04:02:44 +0800] "GET /sns/space.php?uid=323 HTTP/1.0" 200 7535 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp China; http://misc.yahoo.com.cn/help.html)" (注:雅虎)

65.55.220.217 - - [11/Jan/2009:04:02:57 +0800] "GET /ucenter/avatar.php?uid=12373&size=small&type=virtual HTTP/1.1" 301 - "-" "msnbot-media/1.1 (+http://search.msn.com/msnbot.htm)" (注:MSN)

日志文件样板全文下载:

http://edu.seowhy.com/ziliao/wwwlog20090112.log

如何分析日志

蜘蛛名称:百度->baiduspider、Google ->Googlebot、Msn ->msnbot、yahoo ->Slurp、yodao ->YoudaoBot、sogou ->Sogou+get+spider。在日志文件里,搜索以上蜘蛛名称。就可以看到蜘蛛抓取的痕迹。

我们分析的主要点是,HTTP状态码,如以上的200和301。

" 200 5162 " 代表正常抓取,这次抓取了5162个字节。

不同的服务器或虚拟主机设置的日志记录内容不同。

有的如:200 0 33834 237 953 我们通过多看几条记录,观察规律,可以判断第三个数字代表字节数。

有的如:200 0 0或200 0 64 这是没有记录抓取字节数。注意:200 0 0和200 0 64 没代表什么问题。所谓200 0 64代表要被K的言论没有根据,一般的网站都有64代码。

在日志里,发现比较多的HTTP状态码是,200(正常)、304(没变化)、404(错误链接)。

304代表,自从上次抓取后,该内容没有更新。一般情况下,网站的图片经常会返回该值。

404代表,访问的这个链接是错误链接。这个错误链接,一方面来自原本存在后来删除了网页,另一方面可能来自本来就不存在,但其他人外链了这么个死链接。

来源:搜外网


Public @ 2012-04-17 15:32:53

SEO之建立有效页面数据库:目的、定义、流程、应用

关于 SEO 运营观,简明提到,好的 SEO 工作开展,是需要从「需求形成产品」再到「流量获取及转化」贯穿始终的。文中有这么一段话:SEO 运营观(传递价值,变现产品)。SEO运营公式:有效查询覆盖 × 有效抓取 × 有效收录 × 展现 × 点击 × 转化「有效」界定了目标性,尤其需要对查询、抓取、收录做界定。一个公式的成立,常识是默认为任何一个环节都是有效。我之所以在「查询覆盖」、「抓取」、「收

Public @ 2020-03-11 15:26:57

为什么不建议网站使用flash?使用flash对网站SEO的影响

有多大? 1. 使用flash无法被搜索引擎抓取,使网站排名受到影响,SEO效果不好。 2. 如果使用flash,网站的结构及导航将不易浏览,对用户的体验也不佳。 3. 由于flash对用户使用的体验不好,搜索引擎搜索到的网站也不能满足用户的需求,网站的排名也就被削弱。 4. 由于搜索引擎无法抓取flash,对SEO的影响是非常大的,用户点击搜索结果时,也无法访问整个页面,降低了网站的曝光

Public @ 2023-02-26 20:54:19

Linux系统云服务器查看/启用网站日志

查看网站日志BT环境进入BT管理面板中,点击左侧“网站”-对应站点--点击“设置”-配置文件,查看access_log行 (access_log为网站访问日志 ,error_log为网站错误日志)图片1.pngWDCP环境进入wdcp点击左边“站点管理”-“站点列表”,找到要设置的站点,点站点后面对应的“编“按钮,勾中”开启访问日志“即可,日志文件目录 /home/web_logs图片2.png自

Public @ 2010-04-07 15:32:48

怎样看原始日志文件

读者hiisee问请问如何用PHP脚本在后台获取蜘蛛的详细信息呀?如哪里的蜘蛛/何时来的/搜索了哪几个页面/哪些它喜欢哪些不喜欢等,和判断浏览器是不是用一样的技术?谢谢,再次麻烦您了.刚好关于流量统计和分析以前还没有谈过,这两天分几个方面专门谈一下。今天先来谈作为SEO,怎样读服务器原始日志文件(server raw logfile)。网站服务器会把每一个访客来访时的一些信息自动记录下来,存在服务

Public @ 2013-10-12 15:32:49

更多您感兴趣的搜索

0.701041s