Python数据分析师集训班 - 3个月:企业想要在竞争激烈的市场中胜出,决策的速度和反应的效率尤为重要。根据调查显示,75%的企业在面临拟定策略时,常常无法获得实时且有根据的决策信息。什么样的数据、要透过什么样的方法,才能快速且实时的转变成决策时有用的信息,是现代企业所面临最迫切性的问题。
Python数据分析集训课程针对针对周末时间充裕、零基础的专科、本科在校生,以及在职&欲转行从事数据分析的工作人员提供3个月非脱产周末集训,毕业可推荐相关工作。
课程内容以CDA数据分析师标准大纲要求,包含Python基础 – Pandas数据清洗 - Python爬虫 - Python数据可视化(Matplotlib、Seaborn、Pyecharts) - Python机器学习算法等内容,并结合互联网保险、电信、银行、医疗、交通等行业实际案例来帮助学员建立整套的数据分析和机器学习思路,案例涉及营销优化、风险控制、用户研究、商业部署等领域,使学员所学更符合企业要求。
熟练掌握数据科学领域最受欢迎的编程语言-Python
掌握使用Python和pandas库进行数据清洗和预处理
使用Python爬虫获取网络数据
学会使用matplotlib、seaborn进行初级可视化
学会使用Pyecharts进行高级数据可视化
学会构建机器学习算法进行分类、预测和聚类模型
使用Python进行数据分析整体思路、针对业务做出模型最优化选择
善用机器学习解决用户画像、精准营销、风险管理等商业问题
使用机器学习实操电商、电信、医药行业真实项目案例
想从事数据领域工作,缺乏实践技能的在校学生
希望转行数据领域人员
个人发展遭遇瓶颈的数据分析师
有数据化运营需求的产品运营、市场人员及管理者
对Python数据分析和挖掘感兴趣的业界人士
1章Python基础
1-1准备工作-Python开发环境配置
1-2Python标准数据类型
1-3控制流语句
1-4异常和错误(穿插在其他内容中讲)
1-5文件操作
2章Python进行数据整理和数据清洗
2-1Python标准库简介
2-2Numpy数组基础
2-3Pandas对象基础
3章python数据可视化(线上)
3-1绘图思想的基本原理
3-2Python数据可视化包-Matplotlib介绍
3-3使用Python数据处理包Pandas做可视化
3-4Python数据可视化包-Seaborn介绍与图形绘制
3-5Python数据可视化包-Pyecharts介绍与图形绘制
4章Python爬虫(线上)
4-1网络爬虫基础知识
4-2网络请求及响应-requests库
4-3HTML文档解析-BeautifulSoup库
4-4常见反爬虫机制及应对
4-5网络爬虫 VS 网络数据抓取
4-6实战一:批量下载头像
4-7实战二:抓取豆瓣书籍简介
4-8实战三:模拟浏览器selenium抓取电商商品信息及评论
5章Python数据清洗高级操作及案例实战
5-1数据的获取与存储
5-2数据探索
5-3数据清洗思维
5-4数据清洗实战案例一:泰坦尼克幸存者数据清洗(根据实际上课情况调整数据集)
5-5数据清洗实战案例二:USDA食品数据清洗(根据实际上课情况调整数据集)
6章Python编程考试(线上)
6-1Python基础部分
6-2Python数据清洗的实现
7章机器学习算法
7-1准备工作:开发环境配置(以文档的形式给出)
7-2机器学习入门介绍:
7-3scikit-learn入门:Scikit-Learn库简介
7-4KNN-最近邻分类算法:原理、实现
7-5决策树算法:原理、实现、相关技术应用及实例
7-6随机森林算法:原理、实现及相关技术应用:以乳腺癌预测为例
7-7K-Means聚类算法:原理、实现及簇选择与矢量化应用
7-8关联规则算法:原理、实现
7-9线性回归
7-10逻辑回归
7-11SVM支持向量机
7-12分类模型的评估指标(续)
7-13朴素贝叶斯算法
8章电商案例
8-1分析目标:
8-2基于国外大型电商用户购买信息数据的客户购买预测模型构建流程:
9章评分卡案例
9-1分析目标:
9-2基于大型公司的客户贷款信息,构建用户信用评分卡模型的建模步骤: