相关动态
【Hadoop笔记_4】项目案例实战
2024-11-10 18:08

【Hadoop笔记_4】项目案例实战

  • 第一部分:Hadoop介绍及安装

  • 第二部分:HDFS

  • 第三部分:MapReduce

分析资料

  • 链接:https://pan.baidu.com/s/1sn9uRWi3Rhl4GL4g04Tv5w 提取码:zidg

6.1 项目开发流程

在这里插入图片描述

6.2 项目任务

6.2.1 合并小文件

说明

  • 由于在网络上挖掘下来的数据可能不止一个文件,而对每一个小文件进行MapReduce分析则需要分成等数量的块,很可能会对mapreduce造成很大的压力,所以在之前根据需求有必要进行一个简单的文件合并

代码

FirstStep.java
 
6.2.2 完成网站KPI指标的统计

说明

  • KPI:关键业绩指标
  • 我们可以通过KPI看出这个网站的经营状况
  • 这里我们统计和
1、页面访问量统计

代码

LogEntity.java
 
WebVisitsNumsJob.java / WebVisitsNumsMapper.java / WebVisitsNumsReduce.java
 
2、页面访问量统计数据写到MySQL数据库中

代码

LogWritable.java
 
MRToMysqlMapper.java / MRToMysqlJob.java
 
3、页面独立IP的访问量统计

说明

  • 独立IP,即统计每个IP的访问量

代码

LogEntity.java
 
AloneIPVisitsNumsMapper.java / AloneIPVisitsNumsCombiner.java
 
AloneIPVisitsNumsReduce.java / StringSameCount.java
 
AloneIPVisitsNumsJob.java
 
4、页面独立IP的访问量统计写到MySQL中
AloneIpWritable.java
 
MRToMysqlMapper.java / MRToMysqlJob.java
 

6.2.3 在网页上显示 网页访问量统计的top5
1、MVC框架说明

M:module,业务模型,用于提供数据

V:view,视图、用户界面,用于显示数据

C:controller,控制器、分发,用于分发请求

2、新建Web项目

之前已经使用分析出了结果,并将数据写入到了中,现在如果要将数据显示到网页上就得新建一个web项目

  1. 新建一个web项目-

  2. 设置为3.0即可

  3. 一直,最后勾选然后即可。

3、项目结构

在这里插入图片描述

4、代码
1、实体类
 
2、工具类
 
3、Dao层
 
 
4、控制层
 
5、页面
 

6.2.4 在网页上显示 独立Ip访问量统计的Top10

说明

  • 前面实现了的显示,所以这里只需要在其基础上添上几笔
1、实体类
 
2、工具类
 
3、Dao层
 
4、控制层
 
5、页面
 

6.2.5 每天最高访问量
1、MapReduce统计
 
2、写出到MySQL中
 
 
3、显示到页面中

这里和前面一样,只需要添加一些类就可以了

1、实体类
 
2、dao层
 
3、控制层
 
4、页面
 

6.2.6 统计用户每小时的页面访问量(PV,page view

说明

  • 统计24小时类各个小时 页面的访问量
1、MR统计每个小时的访问量
 
2、录入到MySQL中
  • 建表
  • 创建序列化类
  • MR写出数据
 
 
3、显示到页面中
1、实体类
 
2、dao层
 
3、控制层
 
4、页面
 

6.2.7 统计用户的访问设备

说明:

  • 统计用户访问页面使用的设备
1、MR统计各个访问记录使用的设备,并统计相同设备的数量
 
2、MR录入到MySQL中
 
 
3、显示到页面中
1、实体类
 
2、dao层
 
3、控制层
 
4、页面
 

使用技巧

最新文章
郑州SEO优化攻略,揭秘助力企业网络飞跃的策略精髓
郑州SEO网络优化推广,为企业提供专业网络策略,提升网站排名,增强品牌曝光度。通过精准关键词、高质量内容、优化用户体验,助
揭秘网站刷关键词排名软件,效果与风险并存
随着互联网的飞速发展,网络营销已经成为企业推广产品和服务的重要手段,在众多网络营销策略中,提高网站在搜索引擎中的关键词排
科大讯飞AI智能写作:全方位助力文案创作与优化,解决多种写作需求
在数字化浪潮的推动下智能写作成为了提升工作效率、优化内容品质的关键工具。科大讯飞智能写作以其强大的语言解决能力和丰富的创
支付宝小程序搜索排名优化,算法规则基础了解
小程序市场可谓是百花齐放,争奇斗艳。小程序搜索排名优化则为小程序获利提供了强大的支持。做优化首先要知道平台的规则&#
解析国内AI写作平台:创新背后的挑战与突破
一、国内 AI 写作平台兴起近年来,随着人工智能技术的飞速发展,国内 AI 写作平台如雨后春笋般涌现。这些平台利用深度学习、自然
解析百度的绿萝算法怎样识别买卖链接
  作为站长,大家都知道,百度于2013年2月20日推出了最新的搜索引擎算法,起名叫绿萝,公告称这个新算法主要是打击买卖链接的
揭秘刷神马SEO排名秘籍,轻松提升网站搜索地位!
深度解析刷神马SEO排名真相与策略,分享实用技巧,助力网站高效提升排名,轻松占领搜索引擎前列!随着互联网的快速发展,SEO(搜
亚马逊运营必备实用工具
常常看见有卖家小伙伴提问利用什么做数据分析、用什么选品等话题。这里强烈建议各位亚马逊卖家以及准备入驻亚马逊卖家的朋友收藏
如何打造一个高效的营销型企业网站,营销型企业网站的核心特点是什么
打造高效营销型企业网站,需关注用户体验、SEO优化、内容质量及数据分析。核心特点为:用户导向、易用性高、转化路径明确。如何
佛山专业SEO优化助力企业电商营销新飞跃
佛山商品SEO优化公司,凭借专业技术和丰富经验,为企业提供全方位互联网营销解决方案。通过精准关键词优化、内容营销、数据分析
相关文章