找回密码
 注册
查看: 1060|回复: 0

新手如何利用工具查看搜索引擎爬取网站IIS日志

[复制链接]
发表于 2011-9-4 12:24:27 | 显示全部楼层 |阅读模式
今天就新手如何利用工具查看搜索引擎爬取网站IIS日志写一篇基础博文吧!  
这些都是SEO的基础知识了,搭建这个博客别无它意,只是想记录我学习SEO和PHP编程过程的笔记和一些想法和经验,可能有些说的很简单,就是因为自己记不住,所以用博客记录它的存在。  
此篇希望可以帮助新手快速了解IIS日志查看,相信SEO的朋友都知道IIS日志是什么吧,网站IIS日志有什么用呢?  
呵呵 ,简单的说 网站IIS日志 就是指 记录各种搜索引擎来爬取网站的行为状态码,并已文件的方式生成IIS日志。  
那么网站IIS日志可以给我们网站带来什么好处呢?  
查看网站IIS日志可让我们知道网站的死链接,301,202,等等,可让我们知道网站那些链接是搜索引擎经常爬取的,每天那些页面是被搜索引擎爬取过,也可以用于分析网站为什么不收录,或者网站快照为什么不更新,等等很多好处。  
老手可以不需要工具就可以看明白网站IIS日志文件了,那么新手呢,新手可能不明白是什么,那么今天 怀化SEO 就简单的介绍下吧!  
1、先说说不用工具怎么看网站IIS日志吧!  
首先你使用的空间必需可以查看IIS日志,像自己的服务器、VPN服务器等等,可能有很多的站长都是虚拟空间吧,毛是有很多的空间有后台可以操作网站IIS日志的吧。至于空间支不支持查看IIS日志,自己问问网站空间商就知道了,这里就不讲了。  
我现在是以VPN服务器操作哈!(这里 IIS 6.0)  


  
windows_iis查看日志  
点击属性可以知道网站IIS日志文件是在那个目录文件里!  


  
iis日志  
然后我们可以到找该目录下相应IIS日志文件,就可以分析相应网站的IIS日志了。  
下面是IIS日志文件里的一些参数说明:  
默认状态下,IIS 把它的日志文件放在 %WINDIR\System32\Logfiles 文件夹中。每个万维网 (WWW) 站点和 FTP 站点在该目录下都有一个单独的目录。在默认状态下,每天都会在这些目录下创建日志文件,并用日期给日志文件命名(例如,exYYMMDD.log)。如:ex100326.log  
下面我们从一段日志来分析:  
#Software:Microsoft Internet Information Services 6.0  
#Version: 1.0  
#Date: 2010-03-26 01:14:22  
#Fields: time cs-method cs-uri-stem c-ip sc-status sc-bytes cs-bytes  
01:14:21 GET /show2.asp 203.208.60.210 200 15046 287  
作为新手,看见这个肯定会一头雾水,别急,下面我给大家一一道来  
1、#Software: Microsoft Internet Information Services 6.0  
说明这个日志是由IIS这个工具生成的。  
2、#Version: 1.0  
版本号:1.0  
3、#Date: 2010-03-26 01:14:22  
生成时间:2009-03-26 01:14:22  
4、time: 访问时间”01:14:21″。  
5、cs-method: 访问方法。常见的有两种:GET与POST。GET通俗点讲就相当于在IE地址栏敲下地址所产生的访问,POST是一种表单提交,比如数据较大,涉及到隐私都都需要用POST,但不一定,表单提交也可以是GET方式。  
6、cs-uri-stem: 指的是访问哪个地址,如:/show2.asp。  
7、c-ip:客户端ip”203.208.60.210″。  
8、sc-status:访问状态:200表示成功,404表示找不到页面。  
9、sc-bytes:服务器发送的字节数”15046″。  
10、cs-bytes:服务器接受的字节数”287″。  
附:IIS日志中记录的字段及详细说明  
date:发出请求时候的日期。  
time:发出请求时候的时间。注意:默认情况下这个时间是格林威治时间,比我们的北京时间晚8个小时,下面有说明。  
c-ip:客户端IP地址。  
cs-username:用户名,访问服务器的已经过验证用户的名称,匿名用户用连接符-表示。  
s-sitename:服务名,记录当记录事件运行于客户端上的Internet服务的名称和实例的编号。  
s-computername:服务器的名称。  
s-ip:服务器的IP地址。  
s-port:为服务配置的服务器端口号。  
cs-method:请求中使用的HTTP方法,GET/POST。  
cs-uri-stem:URI资源,记录做为操作目标的统一资源标识符(URI),即访问的页面文件。  
cs-uri-query:URI查询,记录客户尝试执行的查询,只有动态页面需要URI查询,如果有则记录,没有则以连接符-表示。即访问网址的附带参数。  
sc-status:协议状态,记录HTTP状态代码,200表示成功,403表示没有权限,404表示找不到该页面,具体说明在下面。  
sc-substatus:协议子状态,记录HTTP子状态代码。  
sc-win32-status:Win32状态,记录Windows状态代码。  
sc-bytes:服务器发送的字节数。  
cs-bytes:服务器接受的字节数。  
time-taken:记录操作所花费的时间,单位是毫秒。  
cs-version:记录客户端使用的协议版本,HTTP或者FTP。  
cs-host:记录主机头名称,没有的话以连接符-表示。注意:为网站配置的主机名可能会以不同的方式出现在日志文件中,原因是HTTP.sys使用Punycode编码格式来记录主机名。  
cs(User-Agent):用户代理,客户端浏览器、操作系统等情况。  
cs(Cookie):记录发送或者接受的Cookies内容,没有的话则以连接符-表示。  
cs(Referer):引用站点,即访问来源。  
2、下面是使用网站IIS查看工具!  
此工具使用非常简单,只需要几步就可以了 此工具不需要安装,直接解压到相应的目录就可以分析IIS日志文件了!  
一、下载好“网站日志分析工具 v6.0” 后解压,然后打开软件。  
二、打开软件后,选择“选择日志目录”此项,添加一个站点,也就是选择一个网站的IIS日志文件,(你可以把网站的IIS日志下载到自己的电脑上,也可以把此软件下载到自己的服务器)  
只要选择IIS日志文件所在路径就可以分析了,  
三、选择查询那天的IIS日志文件,和搜索引擎类型,及网站的状态码。  
直接上图片吧!  


  
网站日志查看工具v6.0  
此工具网上到处都有的下载,名字就叫“网站日志分析工具”!  
我是在这里下载的 直接给下载地址吧,需要的朋友可以到此地方下载


http://www.crsky.com/soft/21740.html
下载时请自行用杀毒软件查下。  
今天就写到这里了。  
本文来源于胡立伟 IT -怀化SEO - 原文地址:
http://www.25mms.com/?p=177
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

QQ|Archiver|手机版|小黑屋|鼠窝站长论坛

GMT+8, 2024-12-29 09:47 , Processed in 0.049631 second(s), 16 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表