热线电话:4000-51-9191
首页
课程中心
新闻资讯
搜索
登录
首页
系统课
CDA大数据分析师周末班
CDA大数据分析师周末班
远程班
随报随学
立即报名
课程简介
CDA大数据分析师周末班:CDA大数据分析师课程以大数据分析技术为主线,以大数据分析师为培养目标,从数据分析基础、linux操作系统入门知识学起,系统介绍Hadoop、HDFS、MapReduce、Hive和Hbase等理论知识和基于Spark平台的大数据分析和机器学习应用,详细演示Hadoop三种模式的安装配置,以案例的形式,讲解基于PySpark技术的回归、分类和聚类分析等大数据分析场景和案例。课程的重点是培养学员基于Hadoop架构的大数据分析实操能力,从零开始学习hadoop搭建,掌握Spark,手把手带练,8周成为行业急需的大数据分析人才,学完即可满足CDA LEVEL II大数据分析师考试知识考核需求。讲解案例包括但不限于金融大数据分析、气象大数据分析、Web海量日志大数据分析、智慧高速大数据分析等。
学习目标
掌握使用Hadoop架构应用于大数据分析
掌握使用大数据分析之数据库理论和工具Mysql、Hbase、Hive和Sqoop
掌握使用Spark-SQL进行交互式数据查询
掌握使用Spark-Streaming流式计算框架
掌握使用Spark-MLlib进行机器学习
掌握使用Spark-GraphX进行图计算
掌握使用Pyspark进行大数据分析和机器学习
掌握企业真实的大数据分析场景案例
学习目标
掌握使用Hadoop架构应用于大数据分析
掌握使用大数据分析之数据库理论和工具Mysql、Hbase、Hive和Sqoop
掌握使用Spark-SQL进行交互式数据查询
掌握使用Spark-Streaming流式计算框架
掌握使用Spark-MLlib进行机器学习
掌握使用Spark-GraphX进行图计算
掌握使用Pyspark进行大数据分析和机器学习
掌握企业真实的大数据分析场景案例
01
章
预习课程
01-01
大数据分析基础
01-02
Python编程基础知识
01-03
Linux&Ubuntu操作系统基础
02
章
大数据前沿应用与开源框架Hadoop
01-01
大数据时代前沿与技术
01-02
Hadoop生态系统和技术栈
01-03
Hadoop单机环境搭建
01-04
Hadoop伪分布式集群搭建
01-05
Hadoop完全分布式集群搭建
01-06
安装和使用Ubuntu系统
01-07
HDFS分布式文件系统介绍
01-08
HFDS进行文件读写操作
01-09
MapReduce编程概念、框架和流程
01-10
Hadoop & Yarn知识介绍
03
章
分布式数据仓库技术-Hbase/Hive
01-01
Hbase简介与架构
01-02
Hbase集群模式安装
01-03
Hbase Shell详解
01-04
Hive基础知识
01-05
Hive技术架构
01-06
Hive DDL与DML语言介绍
04
章
关系型数据库技术-Mysql理论及实战
01-01
数据库的概念与技术、创建数据库
01-02
数据表操作、数据类型与约束条件
01-03
数据表插入数据与导入外部数据方法
01-04
检查与修改数据表
01-05
SQL常用函数介绍
01-06
SQL单表查询与多表查询
01-07
查询操作符与子查询
01-07
SQL实战:使用SQL语句处理及查询电商业务数据
05
章
分布式计算引擎-Spark入门
01-01
Scala语法知识介绍
01-02
Scala函数
01-03
Scala对象操作
01-04
Spark简介
01-05
Spark运行架构
01-06
RDD的创建和操作
01-07
Spark SQL简介
01-07
临时表和SQL查询
06
章
分布式计算引擎-Spark进阶
01-01
日志采集系统Flume和分布式消息队列Kafka入门
01-02
流式计算框架Spark Streaming基本原理及使用方法
01-03
流式计算框架Structured Streaming基本原理及使用方法
01-04
Spark GraphX入门及基本使用方法
01-05
分布式算法库Spark MlLib入门介绍
01-06
Spark ML与Spark MLLib
01-07
机器学习工作流
01-08
机器学习项目-房价预测
07
章
大数据可视化
01-01
绘图思想的基本原理
01-02
Python数据可视化包-Matplotlib介绍
01-03
使用Matplotlib进行基本的图形绘制
01-04
使用Python数据处理包Pandas做可视化
01-05
Python数据可视化包-Seaborn介绍与图形绘制
01-06
Python数据可视化包-Pyecharts介绍与图形绘制
01-07
数据可视化技巧与方法
08
章
大数据与Python结合-Pyspark机器学习
01-01
Spark数据结构及编程语言接口
01-02
PySpark开发环境搭建
01-03
PySpark编程入门:Spark基本数据结构
01-04
PySpark编程入门:PySpark常用语句
01-05
Spark与分布式数据库和分布式数据仓库的集成方法
01-06
采用PySpark读取分布式数据库中数据
01-07
PySpark数据清洗案例
01-08
数据挖掘和机器学习的基本思想与方法论
01-09
机器学习部分算法串讲:有监督、无监督、半监督
01-10
机器学习实战项目介绍
09
章
大数据企业项目案例实做
01-01
基于大数据平台的互联网金融监管实战
01-02
大数据交通案例
01-03
大数据金融案例
登录
立即登录
新用户将自动以手机号登录