干货|可视化分析web访问日志-创新互联-成都快上网建站

干货|可视化分析web访问日志-创新互联

内容目录

  • Python 基础
  • 使用模块介绍
  • 可视化组件 echarts 介绍
  • Web 访问日志
  • 代码解读

    讲师:KK

多语言混搭开发工程师,多年 PHP、Python 项目开发经验,曾就职 360、绿盟科技,7年工作经验。擅长于 Web 安全开发、性能优化、分布式应用开发&设计等多方面,51Reboot 金牌讲师。

成都创新互联公司致力于互联网品牌建设与网络营销,包括网站制作、成都网站设计、SEO优化、网络推广、整站优化营销策划推广、电子商务、移动互联网营销等。成都创新互联公司为不同类型的客户提供良好的互联网应用定制及解决方案,成都创新互联公司核心团队10年专注互联网开发,积累了丰富的网站经验,为广大企业客户提供一站式企业网站建设服务,在网站建设行业内树立了良好口碑。

Python 基础

  • 数值、字符串、列表、字典、文件的使用
  • with 关键字使用
  • 函数、lambda 函数、sorted
  • 时间类型转化

时间类型转化

干货|可视化分析 web 访问日志

统计 list 中每个元素出现的次数

languages = ['python', 'java', 'python', 'c', 'c++', 'go', 'c#', 'c++', 'lisp', 'c', 'javascript', 'java', 'python', 'matlab', 'python', 'go', 'java']
干货|可视化分析 web 访问日志

常用模块

  • os/os.path 系统/文件路径操作

    • os.mkdir/os.rmdir/os.unlink/os.listdir

    • os.path.join/os.path.abspath/os.path.dirname/os.path.exists
  • argparse 命令行参数解析

    • add_argument(short_name, full_name, type, desc, default, help, choices, nargs, action)
  • shutil 文件/文件夹操作

    • shutil.copy2/shutil.copytree/shutil.rmtree
  • logging 日志记录

    • logging.basicConfig(level, format, filename, filemode)

    • https://www.jianshu.com/p/4a801f61ecda
  • jinja2 模板引擎,用于根据模板生成文件

    • 使用步骤(3步走)

      * 创建加载器
                  * 获取模板
                  * 渲染
  • 模板语言

    • 打印变量
    • 流程控制(条件、循环)
    • 过滤器
    • 模板继承
  • geoip2 用于 maxmind 二进制库 mmdb 查询
    • 打开文件
    • 获取 ip 信息(国家、城市、地理位置等)
    • 关闭文件

可视化组件 echarts 介绍

  • 项目地址:http://echarts.baidu.com/echarts2/
  • 项目介绍:可视化JS组件
  • 目前主要版本:2.0 & 3.0
  • 使用步骤(3 + 3):http://echarts.baidu.com/echarts2/doc/start.html
  • 常用图形
    • 饼状图
    • 曲线图
    • 柱状图
    • 仪表盘
    • 地图
    • K 线图

Web 访问日志

  • Web 访问日志是 web 服务器记录的网站被访问的过程日志
  • 日志属性
    • 什么时候
    • 什么人
    • 通过什么工具
    • 以什么方式
    • 访问了什么资源
    • 结果是什么(状态/返回数据大小)
  • 每天的点击量、总点击数量
    • 每天的日志行数、日志的总行数(每天的日志行数之和)
  • 每天的浏览者数量、总浏览者数量
    • 每天的不重复的 IP 的数量
    • 总的不重复的 IP 数量(每天不重复的 IP 数量之和???)
  • 发生错误的请求有多少次,状态码分布情况
    • 每种状态码出现的次数
  • 每天流量大小
    • 每天的日志中每行流量之和
    • 总的流量之和(每天流量之和)
  • 访问地域分布
    • 根据 IP 获取地理位置
  • 发生访问次数最多 TOP N IP 列表
  • 通用日志的格式
    干货|可视化分析 web 访问日志

  • 组合日志格式
    • 127.0.0.1 - - [14/May/2017:12:51:13 +0800] "GET /index.html HTTP/1.1" 200 4286 "http://127.0.0.1/" "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36“

远程主机 IP - - 请求时间 时区 方法 资源 协议 状态码 发送字节 referer 字符 浏览器信息

一些重点代码的解读

  • 程序入口
    干货|可视化分析 web 访问日志

  • 主程序
    干货|可视化分析 web 访问日志

  • 每天统计项
    干货|可视化分析 web 访问日志

  • 总统计项
    干货|可视化分析 web 访问日志

  • 模板页面(显示内容)
    干货|可视化分析 web 访问日志

  • 模板页面(echart)
    干货|可视化分析 web 访问日志

  • 模板页面(控制流程)
    干货|可视化分析 web 访问日志

更多项目代码分享结束后资料一并分享给大家。

获取资料

另外有需要云服务器可以了解下创新互联scvps.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。


网站标题:干货|可视化分析web访问日志-创新互联
分享网址:http://kswjz.com/article/iesdh.html
扫二维码与项目经理沟通

我们在微信上24小时期待你的声音

解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流