课程目标:
通过方法论的学习,掌握针对多变量情形的统计问题对应的理论解决方案。通过实证分析,掌握在遇到多变量的实际问题是怎样用R编程来解决对应的理论问题。
课程主题:
在这门课程中,我们将会从实际的应用场景和方法动机讲起,跟大家一起循序渐进地学习多元统计分析方法,包括多元数据的描述与可视化、多元正态分布、多元统计推断、主成分分析、因子分析、分类分析、判别分析、聚类分析等的数学逻辑、R语言编程实例、和它们背后的故事。
受众定位:
对统计学感兴趣的统计专业或非统计专业的学生、需要数据分析思维的企业人员等。需要一定的统计基础理论作前导知识。
课时
1.1 多元分析的定义
1.2 多元分析的方法简介
1.3 多元分析的应用领域
课时
2.1 一元随机变量回顾
2.2 随机向量
2.2.1 多元数据的数值特征及可视化
2.2.2 协方差矩阵的用途
2.3 随机向量的变换
课时
3.1 多元正态分布
3.2 多元正态分布的性质
3.3 多元正态的估计
3.4 评估多元正态性
课时
4.1 多元检验的冬季
4.2 单样本均值向量检验
4.3 两样本均值向量检验
4.3.1 独立样本
4.3.2 成对样本
课时
5.1 判别分析和分类分析概述
5.2 判别分析:分类规则
5.2.1 两群体Fisher线性判别分析
5.2.2 多群体Fisher线性判别分析
5.3 分类分析:分类结果
5.3.1 两群体Fisher分类
5.3.2 两群体贝叶斯分类
5.3.3 多群体分类
课时
6.1 主成分分析思想
6.2 总体主成分分析
6.2.1 总体主成分推导
6.2.2 基于标准化的总体主成分分析
6.3 样本主成分分析
6.3.1 样本主成分推导
6.3.2 主成分个数的选择
6.3.3 R语言应用实例
课时
7.1 因子分析简介
7.2 载荷估计方法
7.2.1 主成分法
7.2.2 其他方法
7.2.3 估计因子得分
7.3 因子旋转
7.3.1 因子旋转的理解
7.3.2 正交旋转和斜交旋转
7.4 R语言示例
课时
8.1 聚类分析概述
8.2 层次聚类
8.2.1 简介
8.2.2 层次聚类的类型
8.2.2.1 层次聚类的类型(上)
8.2.2.2 层次聚类的类型(下)
8.2.3 R语言示例
8.3 k-均值聚类
8.3.1 方法介绍
8.3.2 R语言示例