热线电话:4000-51-9191

就学培训网

登录
首页系统课机器学习及R应用
机器学习及R应用
机器学习及R应用
  • 远程班 随报随学

课程简介

机器学习及R应用:机器学习早期为人工智能的分支,后来也有不少统计学家加入,最近一、二十年因为其预测精度迅速提高而走红,并在业界有着广泛的应用。可以预见,在未来三十年,几乎所有行业都会因机器学习的深刻冲击而改变。MIT名誉校长Eric Grimson曾预言,机器学习会成为像Word一样的工具。而谁先掌握此工具,则可占得先机,成为时代的弄潮儿(至少不会落伍)。

学习目标

本次“机器学习及R应用”五天现场班将面向所有行业与学科的人士、老师与学生(包含经管社科、医学卫生等领域)。本课程的最大特色在于“一站式服务”,从机器学习的原理、数学推导,到R语言命令与经典案例,无不精心设计、丝丝入扣,理论联系实操,让学员们迅速理解机器学习的精髓,并掌握最为流行的数据科学软件R语言操作。

学习对象和基础

经济及社科类青年教师
经济及社科类博士生
经济及社科类硕士生
经济及社科类高年级本科生
不要求学过机器学习
不要求学过R操作

01机器学习引论

01-01什么是机器学习
01-02机器学习的分类与术语
01-03案例:垃圾邮件过滤;手写体数字识别;图像识别;自动驾驶

02R语言快速入门

02-01Why R?
02-02安装R与RStudio
02-03R的对象(vector, matrix, data frame,list)
02-04面向对象的函数式语言
02-05R语言画图

03数学回顾

03-01梯度向量
03-02方向导数
03-03梯度下降
03-04向量微分
03-05最优化

04线性回归

04-01OLS
04-02过拟合与泛化能力
04-03偏差与方差的权衡
04-04交叉验证
04-05R案例:多项式回归的过拟合;波士顿房价

05逻辑回归

05-01Logit
05-02几率比
05-03灵敏度与特异度
05-04ROC与AUC
05-05科恩的kappa
05-06R案例:泰坦尼克号旅客的存活

06多项逻辑回归

06-01多项Logit
06-02R案例:识别玻璃类别

07判别分析

07-01线性判别分析(LinearDiscriminant Analysis)
07-02二次判别分析(QuadraticDiscriminant Analysis)
07-03费雪判别分析(FisherDiscriminant Analysis)
07-04R案例:鸢尾花品种的归类

08朴素贝叶斯

08-01朴素贝叶斯(Naive Bayes)
08-02拉普拉斯修正(LaplacianCorrection)
08-03R案例:垃圾邮件的识别

09惩罚回归

09-01高维回归的挑战
09-02岭回归(Ridge Regression)
09-03套索估计(Lasso)
09-04弹性网估计(Elastic Net)
09-05R案例:前列腺癌的影响因素

10K近邻法

10-01回归问题的K近邻法
10-02分类问题的K近邻法
10-03R案例:摩托车撞击实验数据;模拟混合数据;威斯康辛乳腺癌的诊断

11决策树

11-01分类树(Classification Tree)
11-02分裂准则(错分率、基尼指数、信息熵)
11-03成本复杂性修枝
11-04回归树(Regression Tree)
11-05R案例:波士顿房价;葡萄牙银行市场营销

12 随机森林

12-01集成学习(Ensemble Learning)
12-02装袋法(Bagging)
12-03随机森林(Random Forest)
12-04变量重要性(Variable Importance)
12-05偏依赖图(Partial Dependence Plot)
12-06R案例:波士顿房价;声呐信号的分类

13提升法

13-01自适应提升法 (AdaBoost)
13-02AdaBoost的统计解释
13-03梯度提升法 (Gradient Boosting Machine)
13-04XGBoost
13-05R案例:波士顿房价;过滤垃圾邮件;识别玻璃类别

14支持向量机

14-01最大间隔分类器(MaximalMargin Classifier)
14-02软间隔分类器(Soft MarginClassifier)
14-03支持向量机(Support Vector Machine)
14-04核技巧(Kernel Trick)
14-05支持向量回归(SupportVector Regression)
14-06R案例:模拟数据;过滤垃圾邮件;识别手写数字;波士顿房价

15人工神经网络

15-01人工神经网络的思想
15-02感知机(Perceptron)
15-03前馈神经网络(Feedforward Neural Network)
15-04激活函数(Activation Function)
15-05反向传播算法(Back-propagation Algorithm)
15-06随机梯度下降(Stochastic Gradient Descent)
15-07神经网络的过拟合与正则化
15-08卷积神经网络(Convolution Neural Network)
15-09深度学习的发展
15-10R案例:波士顿房价;声呐信号的分类;鸢尾花品种的分类

16非监督学习之主成分分析

16-01总体中的主成分分析
16-02样本中的主成分分析
16-03方差分解与降维
16-04主成分回归(PrincipalComponent Regression)
16-05R案例:左右耳听力;香港回归的经济效应

17非监督学习之主成分分析

17-01K-均值聚类(K-meansClustering)
17-02分层聚类(Hierarchical Clustering)
17-03树状图
17-04基于相关系数的距离
17-05R案例:模拟数据;鸢尾花品种的归类

18数据科学的R语言

18-01何为数据科学
18-02管道算子(Pipe Operator)
18-03R包tidyverse(输入数据、数据清理、数据变换)
18-04R包ggplot2(高阶画图)
18-05R包caret(机器学习的统一接口)
18-06R案例:R包tidyverse的自带案例;威斯康辛乳腺癌的诊断

19(Bonus Lecture) 机器学习在经管社科的应用

19-01精读几篇在经管社科顶刊发表的经典机器学习论文