发布于 2014-08-09 11:12:55 | 254 次阅读 | 评论: 0 | 来源: 网友投递
Python编程语言
Python 是一种面向对象、解释型计算机程序设计语言,由Guido van Rossum于1989年底发明,第一个公开发行版发行于1991年。Python语法简洁而清晰,具有丰富和强大的类库。它常被昵称为胶水语言,它能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。
本文是一个用python写的用来分析统计web server的访问日志的代码,可以统计ip访问次数.此脚本只适用ip在每行开头的日志文件,感兴趣的同学参考学习下.
适用的日志格式:
106.45.185.224 - - [06/Aug/2014:07:38:59 +0800] "GET / HTTP/1.0" 200 10 "-" "-" 172.104.119.1 - - [06/Aug/2014:08:55:01 +0800] "GET / HTTP/1.0" 200 10 "-" "-" 25.31.238.235 - - [06/Aug/2014:09:43:19 +0800] "GET / HTTP/1.0" 200 10 "-" "-" 228.65.202.61 - - [06/Aug/2014:10:33:59 +0800] "GET / HTTP/1.0" 200 10 "-" "-"
以上为nginx的日志,本程序只适合用于IP在开头并用空格分开的这种格式。
实例代码:
import sys class Log: def __init__(self, filename,dic,count): self.filename = filename self.dic=dic self.count=count def parse(self): i=1 f=file(self.filename) while True: line=f.readline() if len(line)==0: break ip=line.split(' ') if ip[0] in dic: self.dic[ip[0]]=self.dic[ip[0]]+1 else: self.dic[ip[0]]=i soredic=sorted(self.dic.items(), key=lambda d:d[1],reverse=True) counts=0; for item in soredic: if counts==int(self.count): break print("IP:%s Total Times: %s"%(item[0],item[1])) counts=counts+1 f.close() if __name__=="__main__": if len(sys.argv)<3: print('usage:log.py log.log toptimesnexample log.py log.log 20ncode by iswin') sys.exit() dic={} log=Log(sys.argv[1],dic,sys.argv[2]) log.parse()