热线电话:4000-51-9191

就学培训网

登录
首页系统课CDA 机器学习与深度学习集训营【Level Ⅲ】
CDA 机器学习与深度学习集训营【Level Ⅲ】
CDA 机器学习与深度学习集训营【Level Ⅲ】
  • 北京面授 2024.12.15
  • 远程班 2024.12.15

相关等级报考推荐

  1. Level I
    ¥ 1200
  2. Level II
    ¥ 1700
  3. Level III
    ¥ 2000

课程简介

CDA 机器学习与深度学习集训营【Level Ⅲ】 :CDA Python机器学习周末集训营【Level Ⅲ】,为想希望从事数据挖掘、机器学习工程师相关岗位的人员或者希望通过CDA三级认证考试人员开设。课程设计循序渐进,从基础工具与理论知识入门,进阶机器学习模型、文本挖掘模型,以实战项目案例贯穿课程讲解。其中包括:Python编程基础、数据清洗、数据处理与特征工程、Python机器学习、自然语言处理等课程模块。课程理论知识涵盖CDA LEVEL III等级考试的所有考点,有利于对应等级考试的学员备考。

学习目标

熟练掌握数据科学领域最受欢迎的编程语言-Python
掌握使用Python和pandas库进行数据清洗和预处理
学会使用matplotlib、seaborn进行初级可视化
学会使用Pyecharts进行高级数据可视化
学会构建机器学习算法进行分类、预测和聚类模型
善用机器学习解决用户画像、精准营销、风险管理等商业问题

学习对象和基础

机器学习零基础学员
高校在校生
待业、期待转行从事数据挖掘相关岗位的在职人员
CDA数据分析师level Ⅲ 考生。
希望借助数据挖掘算法来提升解决企业运营、产品运营中涉及的预测问题者
对数据挖掘技术感兴趣的各界人士
产品、运营、营销、管理、咨询相关岗位从业者,希望增加数据挖掘技能与思维


细分课程 内容 详细内容
预习课
(录播)
数据库SQL 1. 数据库基本概念
2. DDL数据定义语言
3. DML数据操作语言
4. 单表查询
5. 多表查询
6. Python连接SQL
Python编程  1. Python标准数据类型
 2. 控制流语句
 3. 自定义函数
 4. 异常和错误
 5. 类与面向对象编程
 6. Numpy数组操作
7. 用Python做数据分析,必会的库Pandas
8. 用Pandas做数据清洗与数据探索
9. Python数据可视化库(Matplotlib,Seaborn)
数学与统计学基础 1. 线性代数
2. 微积分
3. 描述性统计
4. 参数估计
5. 假设检验
6. 相关分析
7. 卡方分析
8. 一元线性回归理论推导
9. 多元线性回归理论推导
附加内容 第1周 周六 ETL数据接入与数据模型管理 1. 数据分类
2. 数据建模
3. ETL基本概念与常用工具
4. 基于Python的ETL程序开发
5. ETL实战项目
6. 数据接入策略与调度工具
机器学习进阶
(Level 3)
周日 大数据平台Spark,数据挖掘导论 1. 数据挖掘导论
2. 梯度下降
3. 分布式存储与计算
4. Spark与Flink工作原理
5. Spark基本语法
6. 使用PySpark实现分布式计算
第2周 周六 决策树 1. 决策树与信息熵
2. ID3, C4.5, CART树
3. 模型调优:网格搜索与交叉验证
4. 决策树的PySpark实现
5. 分类模型的评估(混淆矩阵,ROC等)
6. 决策树之欺诈识别案例
周日 正则回归,Pipeline 1. 正则项的理论基础
2. 带正则项的回归
3. Pipeline工作流专题
4. 使用Pipeline部署算法模型
第3周 周六 关联规则与协同过滤 1. 关联规则(关联规则的概念,评估指标,Apriori算法)
2. 协同过滤
3. 大数据环境下的协同过滤实现
4. 产品组合策略-零售产品捆绑销售策略分析案例
周日 集成算法基础 1. 集成学习的理论基础
2. Bagging, Boosting, Stacking
3. AdaBoost
4. 随机森林
5. GBDT, XGBoost
第4周 周六 爬虫,文本分析 1. 数据的爬取(http原理, requests应用, HTML结构及xpath应用)
2, 非结构化数据的加工处理
3. 文本数据处理之正则表达式
周日 机器学习进阶,人工智能基础 1. LightGBM
2. 数据不平衡问题
3. 进阶调参方法python实践
4. 贝叶斯调参python实践
5. 人工智能基础与网页端的使用
6. 常用人工智能软件
7. 人工智能相关库的环境配置
第5周 周六 人工智能基础 1. 深度神经网络基础:感知器及多层感知器
2. 神经网络架构
3. BP反向传播算法
4. 优化算法专题
5. 卷积神经网络(选修)
6. Pytorch框架与代码实践
7. Openai api之python代码实践
8. 图像分析-手写数字自动识别
周日 聚类分析进阶与异常识别 1. 聚类分析进阶(密度聚类,高斯混合聚类)
2. 聚类分析的Spark实现
3. 异常识别(孤立森林,局部异常因子)
4. 交易反欺诈-异常交易识别案例
第6周 周六 人工智能NLP之文本挖掘 1. 分词与词性标注
2. 文本信息提取
3. 词嵌入与词模型(CBOW与Skip-gram)
4. 构建文本信息库
5. 文本聚类算法
6. 词模型的Pytorch实现
7. 文本分类算法的Pytorch实现
周日 大型项目案例 实战项目-金融风控大型案例
第7周 周六 人工智能NLP之大语言模型LLM 1. 循环神经网络RNN
2. 编码器与迁移学习
3. 残差连接ResNet
4. Transformer架构
5. 大语言模型LLM技术架构与训练方法
6. 开源模型平台与框架的代码实践
7. LLM的本地化部署
第8周 周六 大语言模型LLM前沿方法 1. 聊天机器人的本地化部署
2. Fine tuning
3. Lora专题
4. 本地化LLM的tuning代码实践
5. Agent与Lang Chain
6. 向量数据库与知识库
7. 人工智能NLP的前沿方向
CDA认证考试辅导
(仅限报名考试的学生)
Level 3 认证考试辅导 CDA Level 3 认证考试辅导
1. 数据挖掘概论
2. 高级数据处理与特征工程
3. 自然语言处理与文本分析
4. 机器学习算法
5. 机器学习进阶(自动机器学习,样本不平衡问题,半监督学习,模型优化)
选修课 选修课 1、互联网数字化运营【18课时】
2、何为数据产品经理?【1课时】
3、Python爬虫【15课时】
4、人工智能(深度学习)实战之图像识别【6课时】
5、Tableau多维可视化分析【3课时】
6、统计分析【12课时】