电商项目实战Hadoop实现

1、用户行为日志概述
每一次访问的行为(包括访问,搜索、等)产生的日志
历史行为数据 《== 历史订单
==》推荐
==〉订单的转换率
2、为什么要记录用户行为日志
根据行为日志分析可以很好的有针对性的对不同用户推荐不同商品,以及不同广告的推送

3、日志内容介绍
日志产生的渠道有nginx日志、ajax加载的一些动态的图片、位置啊等等信息。
本次我们提供了一个电商日志打~/data/trackinfo_20130721.data
原始日志说明我们需要的:第二个字段=url、第十四个字段=ip、第十八个字段=时间
字段的解析:我们会从ip中解读出国家、省份、城市,从url中解析出页面的id

4、用户行为日志意义分析的所在
根据用户的行为,比如说访问页面,图片,是手机端,还是PC端,耗费流量是多少,地址在哪,可以有效推广运营,比如手机端就比PC端展示消耗服务商的流量要小能省钱又能减小服务器压力,地址在哪就可以分析出人群分布等等。
referer–》你所反问的页面是从那个上端页面来的,比如你在百度打得广告那就要根据这个给钱的

5、电商常用术语
Ad Views 广告浏览 就是网上广告被用户浏览的次数
PV 访问量 用户每访问一次页面就是一个访问 刷新也算
Impression 印象数 指广告主希望要求的页面每一次的显示,每看到一次广告就是一次印象。
UV 独立访问数 访问的网站或广告,一台电脑被视为一个用户也就是一个访客,24校内相同的客户端只被计算一次
IP 独立IP 24小时内同个IP被计算一次
URL 给出任何服务器上 文件、图像等在网上的位置
关键词:
Band Width 带宽 在某个时刻能够通过传播线路传输的信息(文字、图片、音、视屏)容量,带宽越高传输越快

6、项目需求描述
页面的浏览量 省份的浏览量 页面的访问量

7、数据处理流程及技术框架
电商项目实战Hadoop实现_第1张图片
8、浏览量统计功能实现
电商项目实战Hadoop实现_第2张图片
电商项目实战Hadoop实现_第3张图片
电商项目实战Hadoop实现_第4张图片
电商项目实战Hadoop实现_第5张图片
9、省份浏览量统计之IP库解析
电商项目实战Hadoop实现_第6张图片
电商项目实战Hadoop实现_第7张图片
电商项目实战Hadoop实现_第8张图片
电商项目实战Hadoop实现_第9张图片
电商项目实战Hadoop实现_第10张图片
电商项目实战Hadoop实现_第11张图片
电商项目实战Hadoop实现_第12张图片
电商项目实战Hadoop实现_第13张图片
电商项目实战Hadoop实现_第14张图片
电商项目实战Hadoop实现_第15张图片
电商项目实战Hadoop实现_第16张图片
电商项目实战Hadoop实现_第17张图片
电商项目实战Hadoop实现_第18张图片
电商项目实战Hadoop实现_第19张图片
电商项目实战Hadoop实现_第20张图片
电商项目实战Hadoop实现_第21张图片
电商项目实战Hadoop实现_第22张图片
电商项目实战Hadoop实现_第23张图片
电商项目实战Hadoop实现_第24张图片
电商项目实战Hadoop实现_第25张图片
电商项目实战Hadoop实现_第26张图片
电商项目实战Hadoop实现_第27张图片
电商项目实战Hadoop实现_第28张图片
电商项目实战Hadoop实现_第29张图片
电商项目实战Hadoop实现_第30张图片
电商项目实战Hadoop实现_第31张图片
电商项目实战Hadoop实现_第32张图片
电商项目实战Hadoop实现_第33张图片
电商项目实战Hadoop实现_第34张图片
电商项目实战Hadoop实现_第35张图片
电商项目实战Hadoop实现_第36张图片
电商项目实战Hadoop实现_第37张图片
电商项目实战Hadoop实现_第38张图片
电商项目实战Hadoop实现_第39张图片
电商项目实战Hadoop实现_第40张图片
电商项目实战Hadoop实现_第41张图片
电商项目实战Hadoop实现_第42张图片
电商项目实战Hadoop实现_第43张图片
在这里插入图片描述
电商项目实战Hadoop实现_第44张图片
10、省份统计之日志解析
电商项目实战Hadoop实现_第45张图片
电商项目实战Hadoop实现_第46张图片
电商项目实战Hadoop实现_第47张图片
11、省份浏览量统计之功能实现
电商项目实战Hadoop实现_第48张图片
电商项目实战Hadoop实现_第49张图片
电商项目实战Hadoop实现_第50张图片
电商项目实战Hadoop实现_第51张图片
12、页面浏览量统计之页面编号获取
电商项目实战Hadoop实现_第52张图片
电商项目实战Hadoop实现_第53张图片
13、页面浏览量统计之功能实现
电商项目实战Hadoop实现_第54张图片
电商项目实战Hadoop实现_第55张图片
电商项目实战Hadoop实现_第56张图片
电商项目实战Hadoop实现_第57张图片
电商项目实战Hadoop实现_第58张图片
14、数据处理过程中ETL的重要性
电商项目实战Hadoop实现_第59张图片
15、原始日志ETL操作
电商项目实战Hadoop实现_第60张图片
电商项目实战Hadoop实现_第61张图片
电商项目实战Hadoop实现_第62张图片
电商项目实战Hadoop实现_第63张图片
16、浏览量统计功能升级
电商项目实战Hadoop实现_第64张图片
电商项目实战Hadoop实现_第65张图片
电商项目实战Hadoop实现_第66张图片
17、省份量统计功能升级
电商项目实战Hadoop实现_第67张图片
电商项目实战Hadoop实现_第68张图片
电商项目实战Hadoop实现_第69张图片
电商项目实战Hadoop实现_第70张图片
18、页面浏览量统计功能实现
电商项目实战Hadoop实现_第71张图片
电商项目实战Hadoop实现_第72张图片
电商项目实战Hadoop实现_第73张图片
电商项目实战Hadoop实现_第74张图片
19、打包到服务器执行
电商项目实战Hadoop实现_第75张图片
电商项目实战Hadoop实现_第76张图片
到项目目录 执行 mvn clean package -DiskTest 打包 把打好的包上传到服务器
的~/lib下

然后把ip解析文件传输到服务器目录自己定吧
原始文件上传到服务器HDFS,上传到那个目录参数指定时指定那个
编辑执行脚本如下

你可能感兴趣的:(Hadoop,hadoop,数据库,大数据)