电商日志分析项目 – 03 日志的分析(MapReduce)

MapReduce工程代码

  1. 创建maven工程
    在项目根目录下创建input文件夹,创建一个文本文件access.log用来模拟nginx日志
  2. 引入maven依赖

  3. 添加log4j.properties文件在资源目录下即resources,文件内容如下

  4. 编写MR程序之Mapper:LogMapper.java

  5. 编写MR程序之Mapper:LogReducer.java

  6. 编写MR程序之Job:LogJob.java

  7. 本地运行代码,测试下结果正确与否
  8. 本地运行测试结果正确后,需要对Driver类输入输出部分代码进行修改,具体修改如下:

  9. 打jar包,提交集群运行
    直接使用maven的生命周期的package工具构建jar包,并上传到服务器的/opt/data目录下,改名为Log.jar
  10. 为方便操作,编写脚本/opt/bin/project/exec-mapred-task.sh来执行MR程序

Views: 77