在数字经济时代,利用数字化知识可以使企业摆脱单一供给,并深度挖掘用户需求,探索多元的业务场景。本课程将会从企业的角度出发讲解不同阶段数据应用的建设思路,培养学员掌握企业需要的敏捷算法建模能力,并规划未来发展的路线图。 同时,从找出问题→确定问题→数据清洗→数据建模→数据验证到挖掘出有价值的数据分析思路,并确认适合企业的解决方案。让学员掌握可落地、易操作的数据科学思维和技术模板构建出优秀模型。
课程中涵盖了Sklearn、LightGBM、NLP、PyTorch、Transformer等常用工具的应用实现,并根据输出的结果分析业务需求,为进行合理、有效的策略优化提供数据支撑。 在课程学习中以问题为导向,加强知识点的理解和应用,提高学员面对复杂问题的思考能力。聚焦策略分析技术及企业常用的分类、NLP、深度学习、特征工程等数据算法,只教实用干货,以专精技术能力提升业务效果与效率。
课程涉及大量企业项目案例:精准营销预测、营销策略优化、客户行为分析、风险管理、客户管理、智能推荐、情感分析、反欺诈等,加持实战经验,为学员进入名企提供项目背书。 对数据科学岗位认知程度比较浅的学员,可在职业规划团队老师的帮助下选择适合学员的职业发展路线。进一步从职场综合能力要求出发,通过经验赋能快速提升岗位匹配度。
细分课程 | 周 | 日 | 内容 | 详细内容 |
预习课 (录播) |
数据库SQL |
1. 数据库基本概念 2. DDL数据定义语言 3. DML数据操作语言 4. 单表查询 5. 多表查询 6. Python连接SQL |
||
Python编程基础 |
1. Python标准数据类型 2. 控制流语句 3. 自定义函数 4. 异常和错误 5. 类与面向对象编程 6. Numpy数组操作 7. 用Python做数据分析,必会的库Pandas 8. 用Pandas做数据清洗与数据探索 9. Python数据可视化库(Matplotlib,Seaborn) |
|||
数学与统计学基础 |
1. 线性代数 2. 微积分 3. 描述性统计 4. 参数估计 5. 假设检验 6. 相关分析 7. 卡方分析 8. 一元线性回归理论推导 |
|||
商业策略分析 (Level 2) |
第1周 | 周六 | SQL |
1. 数据库MySQL语句与实战 2. Python连接SQL数据库 3. SQL使用案例 4. 金融行业多表分析案例 |
周日 | 指标体系与数据治理进阶 |
1. 分析基础-数据分析的概念、过程、能力 2. 指标体系的意义与构建 3. 常用指标体系示例 4. 数据治理进阶 5. 淘宝经营分析案例 |
||
第2周 | 周六 | Pandas与数据可视化 |
1. Python基础与数据清洗可视化技术回顾 2. Python数据可视化常用方法 3. 交通数据分析 4. 经典数据集:生还率的影响因素 5. 零售行业产品分析 |
|
周日 | 方差分析,线性回归 |
1. 方差分析 2. 线性回归(模型的建立与估计) 3. 统计模型的检验 4. 识别分析-用户支出影响因素分析案例 |
||
第3周 | 周六 | 逻辑回归,主成分分析 |
1. 逻辑回归(模型的建立与估计) 2. 模型评估 3. 信息压缩-主成分分析与因子分析(数据降维) 4. 成交分析-Talkingviews案例 5. 因子分析-城市发展水平综合分析 |
|
周日 | 标签体系与用户画像 |
1. 标签体系的设计原理 2. 用户标签的制作方法 3. 客群分析-标签体系与用户画像 4. 应用用户画像-信用卡持卡用户画像实战案例 |
||
第4周 | 周六 | 时间序列 |
1. 时间序列分析(ARIMA算法) 2. Box-Jenkins 建模流程 3. 时间序列回归 4. 销售额预测-线上平台销售额预测实战案例 |
|
周日 | 聚类分析,决策树应用 |
1. 层次聚类 2. Kmeans聚类 3. 聚类分析评价方法-决策树应用 4. 用户分群-金融行业运营案例 |
||
第5周 | 周六 | 数据采集与处理,特征工程基础 |
1. 数据采集(概率与非概率抽样) 2. 数据处理方法(数据录入,数据清洗,数据编码) 3. 特征工程基础(特征预处理,特征的选择与转换) |
|
周日 | 数字化工作方法,最优化方法 |
1. 数字化工作方法 2. 运筹优化方法(线性规划与二次优化,基于业务流程的优化) 3. 数字化运营综合案例-某机构营销响应概率预测与风险预测案例 |
||
附加内容 | 第6周 | 周六 | ETL数据接入与数据模型管理 |
1. 数据分类 2. 数据建模 3. ETL基本概念与常用工具 4. 基于Python的ETL程序开发 5. ETL实战项目 6. 数据接入策略与调度工具 |
机器学习与人工智能 (Level 3) |
周日 | 大数据平台Spark,数据挖掘导论 |
1. 数据挖掘导论 2. 梯度下降 3. 分布式存储与计算 4. Spark与Flink工作原理 5. Spark基本语法 6. 使用PySpark实现分布式计算 |
|
第7周 | 周六 | 决策树 |
1. 决策树与信息熵 2. ID3, C4.5, CART树 3. 模型调优:网格搜索与交叉验证 4. 决策树的PySpark实现 5. 分类模型的评估(混淆矩阵,ROC等) 6. 决策树之欺诈识别案例 |
|
周日 | 正则回归,Pipeline |
1. 正则项的理论基础 2. 带正则项的回归 3. Pipeline工作流专题 4. 使用Pipeline部署算法模型 |
||
第8周 | 周六 | 关联规则与协同过滤 |
1. 关联规则(关联规则的概念,评估指标,Apriori算法) 2. 协同过滤 3. 大数据环境下的协同过滤实现 4. 产品组合策略-零售产品捆绑销售策略分析案例 |
|
周日 | 集成算法基础 |
1. 集成学习的理论基础 2. Bagging, Boosting, Stacking 3. AdaBoost 4. 随机森林 5. GBDT, XGBoost |
||
第9周 | 周六 | 爬虫,文本分析 |
1. 数据的爬取(http原理, requests应用, HTML结构及xpath应用) 2, 非结构化数据的加工处理 3. 文本数据处理之正则表达式 |
|
周日 | 机器学习进阶,人工智能基础 |
1. LightGBM 2. 数据不平衡问题 3. 进阶调参方法python实践 4. 贝叶斯调参python实践 5. 人工智能基础与网页端的使用 6. 常用人工智能软件 7. 人工智能相关库的环境配置 |
||
第10周 | 周六 | 人工智能基础 |
1. 深度神经网络基础:感知器及多层感知器 2. 神经网络架构 3. BP反向传播算法 4. 优化算法专题 5. 卷积神经网络(选修) 6. Pytorch框架与代码实践 7. Openai api之python代码实践 8. 图像分析-手写数字自动识别 |
|
周日 | 聚类分析进阶与异常识别 |
1. 聚类分析进阶(密度聚类,高斯混合聚类) 2. 聚类分析的Spark实现 3. 异常识别(孤立森林,局部异常因子) 4. 交易反欺诈-异常交易识别案例 |
||
第11周 | 周六 | 人工智能NLP之文本挖掘 |
1. 分词与词性标注 2. 文本信息提取 3. 词嵌入与词模型(CBOW与Skip-gram) 4. 构建文本信息库 5. 文本聚类算法 6. 词模型的Pytorch实现 7. 文本分类算法的Pytorch实现 |
|
周日 | 大型项目案例 | 实战项目-金融风控大型案例 | ||
第12周 | 周六 | 人工智能NLP之大语言模型LLM |
1. 循环神经网络RNN 2. 编码器与迁移学习 3. 残差连接ResNet 4. Transformer架构 5. 大语言模型LLM技术架构与训练方法 6. 开源模型平台与框架的代码实践 7. LLM的本地化部署 |
|
第13周 | 周六 | 大语言模型LLM前沿方法 |
1. 聊天机器人的本地化部署 2. Fine tuning 3. Lora专题 4. 本地化LLM的tuning代码实践 5. Agent与Lang Chain 6. 向量数据库与知识库 7. 人工智能NLP的前沿方向 |
|
选修课 | 选修课 |
1、互联网数字化运营【18课时】 2、何为数据产品经理?【1课时】 3、Python爬虫【15课时】 4、人工智能(深度学习)实战之图像识别【6课时】 5、Tableau多维可视化分析【3课时】 6、统计分析【12课时】 |