网站日志是记录web服务器接收处理请求以及运行时错误等各种原始信息的以“.log”结尾的文件。通过网站日志分析可以清楚的知道用户在什么IP、什么时间、用什么操作系统、什么浏览器、什么分辨率显示器的情况下访问了你网站的哪个页面,是否访问成功等等。同时,对网站日志分析是seoer必需要掌握的一项基本的技能。
经常查看网站日志的都知道里面的404状态码。日志里404为分两种,一种是用户状态码404,一种是蜘蛛状态码404。对于搜索引擎蜘蛛抓取的404比较好处理,多数直接到网站程序页面找出去掉,然后去百度站长提死链就可以了。而对于用户状态码404,代表用户访问的页面,网站本身不存在的链接(即文件夹或者路径都是不存在的)。用户的搜索行为我们是无法控制的,出现少量404也没什么影响。但是网站出现大量的用户状态码404(几百多),而且每天观察都有,那就要注意了,你的网站可能被搞了。
以下是个人博客网站日志分析情况,通过5天的分析的观察,用户状态码404每天都有500多条以上(相对于别人网站每天几千404来说是比较少的),即文件夹或者路径都是不存在。这就可能有人能过工具恶意扫描我的网站,用户访问输入多数很少错误的。
对于连续出现大量用户状态码404,有以下几种可能:1、别人在找你网站的漏洞(如网站登录地址、密码破解等)2、可能在仿你的网站。3、恶意镜像你的网站。4,其他,总之都是不怀好意的。
而个人博客根据网络日志分析与百度统计结合查看,如下图所示从入口页面的链接可以看出被别人恶意镜像,最近我也没有在本地进行127.0.0.1测试。这里可以找出404所对应的IP地址查询来源。
现在的个人博客小站要么被别人仿站,要么被别人镜像这两种最多。所以要经常观察自己的个人网站,同时做好网站安全防护。更多信息,欢迎讨论。
评论