热线电话:4000-51-9191

就学培训网

登录
首页系统课CDA大数据分析师周末班
CDA大数据分析师周末班
CDA大数据分析师周末班
  • 远程班 随报随学

课程简介

CDA大数据分析师周末班:CDA大数据分析师课程以大数据分析技术为主线,以大数据分析师为培养目标,从数据分析基础、linux操作系统入门知识学起,系统介绍Hadoop、HDFS、MapReduce、Hive和Hbase等理论知识和基于Spark平台的大数据分析和机器学习应用,详细演示Hadoop三种模式的安装配置,以案例的形式,讲解基于PySpark技术的回归、分类和聚类分析等大数据分析场景和案例。课程的重点是培养学员基于Hadoop架构的大数据分析实操能力,从零开始学习hadoop搭建,掌握Spark,手把手带练,8周成为行业急需的大数据分析人才,学完即可满足CDA LEVEL II大数据分析师考试知识考核需求。讲解案例包括但不限于金融大数据分析、气象大数据分析、Web海量日志大数据分析、智慧高速大数据分析等。

学习目标

掌握使用Hadoop架构应用于大数据分析
掌握使用大数据分析之数据库理论和工具Mysql、Hbase、Hive和Sqoop
掌握使用Spark-SQL进行交互式数据查询
掌握使用Spark-Streaming流式计算框架
掌握使用Spark-MLlib进行机器学习
掌握使用Spark-GraphX进行图计算
掌握使用Pyspark进行大数据分析和机器学习
掌握企业真实的大数据分析场景案例

学习目标

掌握使用Hadoop架构应用于大数据分析
掌握使用大数据分析之数据库理论和工具Mysql、Hbase、Hive和Sqoop
掌握使用Spark-SQL进行交互式数据查询
掌握使用Spark-Streaming流式计算框架
掌握使用Spark-MLlib进行机器学习
掌握使用Spark-GraphX进行图计算
掌握使用Pyspark进行大数据分析和机器学习
掌握企业真实的大数据分析场景案例

01预习课程

01-01大数据分析基础
01-02Python编程基础知识
01-03Linux&Ubuntu操作系统基础

02大数据前沿应用与开源框架Hadoop

01-01大数据时代前沿与技术
01-02Hadoop生态系统和技术栈
01-03Hadoop单机环境搭建
01-04Hadoop伪分布式集群搭建
01-05Hadoop完全分布式集群搭建
01-06安装和使用Ubuntu系统
01-07HDFS分布式文件系统介绍
01-08HFDS进行文件读写操作
01-09MapReduce编程概念、框架和流程
01-10Hadoop & Yarn知识介绍

03分布式数据仓库技术-Hbase/Hive

01-01Hbase简介与架构
01-02Hbase集群模式安装
01-03Hbase Shell详解
01-04Hive基础知识
01-05Hive技术架构
01-06Hive DDL与DML语言介绍

04关系型数据库技术-Mysql理论及实战

01-01数据库的概念与技术、创建数据库
01-02数据表操作、数据类型与约束条件
01-03数据表插入数据与导入外部数据方法
01-04检查与修改数据表
01-05SQL常用函数介绍
01-06SQL单表查询与多表查询
01-07查询操作符与子查询
01-07SQL实战:使用SQL语句处理及查询电商业务数据

05分布式计算引擎-Spark入门

01-01Scala语法知识介绍
01-02Scala函数
01-03Scala对象操作
01-04Spark简介
01-05Spark运行架构
01-06RDD的创建和操作
01-07Spark SQL简介
01-07临时表和SQL查询

06分布式计算引擎-Spark进阶

01-01日志采集系统Flume和分布式消息队列Kafka入门
01-02流式计算框架Spark Streaming基本原理及使用方法
01-03流式计算框架Structured Streaming基本原理及使用方法
01-04Spark GraphX入门及基本使用方法
01-05分布式算法库Spark MlLib入门介绍
01-06Spark ML与Spark MLLib
01-07机器学习工作流
01-08机器学习项目-房价预测

07大数据可视化

01-01绘图思想的基本原理
01-02Python数据可视化包-Matplotlib介绍
01-03使用Matplotlib进行基本的图形绘制
01-04使用Python数据处理包Pandas做可视化
01-05Python数据可视化包-Seaborn介绍与图形绘制
01-06Python数据可视化包-Pyecharts介绍与图形绘制
01-07数据可视化技巧与方法

08大数据与Python结合-Pyspark机器学习

01-01Spark数据结构及编程语言接口
01-02PySpark开发环境搭建
01-03PySpark编程入门:Spark基本数据结构
01-04PySpark编程入门:PySpark常用语句
01-05Spark与分布式数据库和分布式数据仓库的集成方法
01-06采用PySpark读取分布式数据库中数据
01-07PySpark数据清洗案例
01-08数据挖掘和机器学习的基本思想与方法论
01-09机器学习部分算法串讲:有监督、无监督、半监督
01-10机器学习实战项目介绍

09大数据企业项目案例实做

01-01基于大数据平台的互联网金融监管实战
01-02大数据交通案例
01-03大数据金融案例