加入收藏 | 设为首页 | 会员中心 | 我要投稿 均轻资讯网 (https://www.junqingwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

大数据分析整体技术流程及架构

发布时间:2022-12-15 11:11:58 所属栏目:大数据 来源:
导读:  大数据分析整体技术流程及架构

  本文对项目中所用到的大数据分析整体流程技术及其架构进行简要的总结大数据技术架构图,以供大家在大数据分析平台对数据处理流程更加明确

  1.1数据处理流程

 
  大数据分析整体技术流程及架构
 
  本文对项目中所用到的大数据分析整体流程技术及其架构进行简要的总结大数据技术架构图,以供大家在大数据分析平台对数据处理流程更加明确
 
  1.1数据处理流程
 
  该项目是一个纯粹的数据分析项目,其整体流程基本上就是依据数据的处理流程进行,依此有以下几个大的步骤:
 
  1)数据采集
 
  首先,通过页面嵌入JS代码的方式获取用户访问行为,并发送到web服务的后台记录日志
 
  然后大数据技术架构图,将各服务器上生成的点击流日志通过实时或批量的方式汇聚到HDFS文件系统中
 
  当然,一个综合分析系统,数据源可能不仅包含点击流数据,还有数据库中的业务数据(如用户信息、商品信息、订单信息等)及对分析有益的外部数据。
 
  2)数据预处理
 
  大数据技术架构图_大数据架构技术有哪些_数据科学与大数据技术介绍
 
  通过程序对采集到的点击流数据进行预处理,比如清洗,格式整理,滤除脏数据等
 
  3)数据入库
 
  将预处理之后的数据导入到HIVE仓库中相应的库和表中
 
  4)数据分析
 
  项目的核心内容,即根据需求开发ETL分析语句,得出各种统计结果
 
  5)数据展现
 
  将分析所得数据进行可视化
 
  1.2项目结构
 
  由于本项目是一个纯粹数据分析项目,其整体结构亦跟分析流程匹配,并没有特别复杂的结构,如下图:
 
  大数据技术架构图_大数据架构技术有哪些_数据科学与大数据技术介绍
 
  其中,需要强调的是:
 
  系统的数据分析不是一次性的,而是按照一定的时间频率反复计算,因而整个处理链条中的各个环节需要按照一定的先后依赖关系紧密衔接,即涉及到大量任务单元的管理调度,所以,项目中需要添加一个任务调度模块
 
  1.3数据展现
 
  数据展现的目的是将分析所得的数据进行可视化,以便运营决策人员能更方便地获取数据,更快更简单地理解数据
 

(编辑:均轻资讯网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!