热线电话:4000-51-9191

就学培训网

登录
首页系统课敏捷算法建模训练营周末班
敏捷算法建模训练营周末班
敏捷算法建模训练营周末班
  • 北京面授 2024.11.02
  • 远程班 2024.11.02

相关等级报考推荐

  1. Level I
    ¥ 1200
  2. Level II
    ¥ 1700
  3. Level III
    ¥ 2000


课程简介


引领数智赋能,精通模型应用

在数字经济时代,利用数字化知识可以使企业摆脱单一供给,并深度挖掘用户需求,探索多元的业务场景。本课程将会从企业的角度出发讲解不同阶段数据应用的建设思路,培养学员掌握企业需要的敏捷算法建模能力,并规划未来发展的路线图。 同时,从找出问题→确定问题→数据清洗→数据建模→数据验证到挖掘出有价值的数据分析思路,并确认适合企业的解决方案。让学员掌握可落地、易操作的数据科学思维和技术模板构建出优秀模型。

涵盖常用工具,完善技术精进

课程中涵盖了Sklearn、LightGBM、NLP、PyTorch、Transformer等常用工具的应用实现,并根据输出的结果分析业务需求,为进行合理、有效的策略优化提供数据支撑。 在课程学习中以问题为导向,加强知识点的理解和应用,提高学员面对复杂问题的思考能力。聚焦策略分析技术及企业常用的分类、NLP、深度学习、特征工程等数据算法,只教实用干货,以专精技术能力提升业务效果与效率。

玩转案例实战,直通企业就业

课程涉及大量企业项目案例:精准营销预测、营销策略优化、客户行为分析、风险管理、客户管理、智能推荐、情感分析、反欺诈等,加持实战经验,为学员进入名企提供项目背书。 对数据科学岗位认知程度比较浅的学员,可在职业规划团队老师的帮助下选择适合学员的职业发展路线。进一步从职场综合能力要求出发,通过经验赋能快速提升岗位匹配度。








细分课程 内容 详细内容
预习课
(录播)
数据库SQL 1. 数据库基本概念
2. DDL数据定义语言
3. DML数据操作语言
4. 单表查询
5. 多表查询
6. Python连接SQL
Python编程基础 1. Python标准数据类型
2. 控制流语句
3. 自定义函数
4. 异常和错误
5. 类与面向对象编程
6. Numpy数组操作
7. 用Python做数据分析,必会的库Pandas
8. 用Pandas做数据清洗与数据探索
9. Python数据可视化库(Matplotlib,Seaborn)
数学与统计学基础 1. 线性代数
2. 微积分
3. 描述性统计
4. 参数估计
5. 假设检验
6. 相关分析
7. 卡方分析
8. 一元线性回归理论推导
商业策略分析
(Level 2)
第1周 周六 SQL 1. 数据库MySQL语句与实战
2. Python连接SQL数据库
3. SQL使用案例
4. 金融行业多表分析案例
周日 指标体系与数据治理进阶 1. 分析基础-数据分析的概念、过程、能力
2. 指标体系的意义与构建
3. 常用指标体系示例
4. 数据治理进阶
5. 淘宝经营分析案例
第2周 周六 Pandas与数据可视化 1. Python基础与数据清洗可视化技术回顾
2. Python数据可视化常用方法
3. 交通数据分析
4. 经典数据集:生还率的影响因素
5. 零售行业产品分析
周日 方差分析,线性回归 1. 方差分析
2. 线性回归(模型的建立与估计)
3. 统计模型的检验
4. 识别分析-用户支出影响因素分析案例
第3周 周六 逻辑回归,主成分分析 1. 逻辑回归(模型的建立与估计)
2. 模型评估
3. 信息压缩-主成分分析与因子分析(数据降维)
4. 成交分析-Talkingviews案例
5. 因子分析-城市发展水平综合分析
周日 标签体系与用户画像 1. 标签体系的设计原理
2. 用户标签的制作方法
3. 客群分析-标签体系与用户画像
4. 应用用户画像-信用卡持卡用户画像实战案例
第4周 周六 时间序列 1. 时间序列分析(ARIMA算法)
2. Box-Jenkins 建模流程
3. 时间序列回归
4. 销售额预测-线上平台销售额预测实战案例
周日 聚类分析,决策树应用 1. 层次聚类
2. Kmeans聚类
3. 聚类分析评价方法-决策树应用
4. 用户分群-金融行业运营案例
第5周 周六 数据采集与处理,特征工程基础 1. 数据采集(概率与非概率抽样)
2. 数据处理方法(数据录入,数据清洗,数据编码)
3. 特征工程基础(特征预处理,特征的选择与转换)
周日 数字化工作方法,最优化方法 1. 数字化工作方法
2. 运筹优化方法(线性规划与二次优化,基于业务流程的优化)
3. 数字化运营综合案例-某机构营销响应概率预测与风险预测案例
附加内容 第6周 周六 ETL数据接入与数据模型管理 1. 数据分类
2. 数据建模
3. ETL基本概念与常用工具
4. 基于Python的ETL程序开发
5. ETL实战项目
6. 数据接入策略与调度工具
机器学习与人工智能
(Level 3)
周日 大数据平台Spark,数据挖掘导论 1. 数据挖掘导论
2. 梯度下降
3. 分布式存储与计算
4. Spark与Flink工作原理
5. Spark基本语法
6. 使用PySpark实现分布式计算
第7周 周六 决策树 1. 决策树与信息熵
2. ID3, C4.5, CART树
3. 模型调优:网格搜索与交叉验证
4. 决策树的PySpark实现
5. 分类模型的评估(混淆矩阵,ROC等)
6. 决策树之欺诈识别案例
周日 正则回归,Pipeline 1. 正则项的理论基础
2. 带正则项的回归
3. Pipeline工作流专题
4. 使用Pipeline部署算法模型
第8周 周六 关联规则与协同过滤 1. 关联规则(关联规则的概念,评估指标,Apriori算法)
2. 协同过滤
3. 大数据环境下的协同过滤实现
4. 产品组合策略-零售产品捆绑销售策略分析案例
周日 集成算法基础 1. 集成学习的理论基础
2. Bagging, Boosting, Stacking
3. AdaBoost
4. 随机森林
5. GBDT, XGBoost
第9周 周六 爬虫,文本分析 1. 数据的爬取(http原理, requests应用, HTML结构及xpath应用)
2, 非结构化数据的加工处理
3. 文本数据处理之正则表达式
周日 机器学习进阶,人工智能基础 1. LightGBM
2. 数据不平衡问题
3. 进阶调参方法python实践
4. 贝叶斯调参python实践
5. 人工智能基础与网页端的使用
6. 常用人工智能软件
7. 人工智能相关库的环境配置
第10周 周六 人工智能基础 1. 深度神经网络基础:感知器及多层感知器
2. 神经网络架构
3. BP反向传播算法
4. 优化算法专题
5. 卷积神经网络(选修)
6. Pytorch框架与代码实践
7. Openai api之python代码实践
8. 图像分析-手写数字自动识别
周日 聚类分析进阶与异常识别 1. 聚类分析进阶(密度聚类,高斯混合聚类)
2. 聚类分析的Spark实现
3. 异常识别(孤立森林,局部异常因子)
4. 交易反欺诈-异常交易识别案例
第11周 周六 人工智能NLP之文本挖掘 1. 分词与词性标注
2. 文本信息提取
3. 词嵌入与词模型(CBOW与Skip-gram)
4. 构建文本信息库
5. 文本聚类算法
6. 词模型的Pytorch实现
7. 文本分类算法的Pytorch实现
周日 大型项目案例 实战项目-金融风控大型案例
第12周 周六 人工智能NLP之大语言模型LLM 1. 循环神经网络RNN
2. 编码器与迁移学习
3. 残差连接ResNet
4. Transformer架构
5. 大语言模型LLM技术架构与训练方法
6. 开源模型平台与框架的代码实践
7. LLM的本地化部署
第13周 周六 大语言模型LLM前沿方法 1. 聊天机器人的本地化部署
2. Fine tuning
3. Lora专题
4. 本地化LLM的tuning代码实践
5. Agent与Lang Chain
6. 向量数据库与知识库
7. 人工智能NLP的前沿方向
选修课 选修课 1、互联网数字化运营【18课时】
2、何为数据产品经理?【1课时】
3、Python爬虫【15课时】
4、人工智能(深度学习)实战之图像识别【6课时】
5、Tableau多维可视化分析【3课时】
6、统计分析【12课时】