R语言数据分析与挖掘
R语言数据分析与挖掘
1万+ 人选课
更新日期:2025/06/01
开课时间2025/03/13 - 2025/07/12
课程周期18 周
开课状态开课中
每周学时-
课程简介

【教学模式】

课程主要采用课堂讲授与课程实验的混合教学模式. 课堂主要讲授数据分析的基本工具、基本原理和基本方法, 旨在帮助学生构建数据分析的基本思维, 掌握数据分析的基本流程. 课程实验主要通过数据分析实验训练学生实际动手能力, 旨在帮助学生掌握R语言, 并能够处理数据, 实现数据的可视化和统计建模.

 

【课程内容】

课程内容主要包括三个部分: R语言基础、数据分析基础,及统计方法与数据挖掘算法, 共15章内容. R语言基础主要讲授R语言的运行环境、R语言的语法、数据处理和数据可视化; 数据分析基础则主要讲授统计的基本概念、区间估计和假设检验; 统计方法与数据挖掘算法主要讲授相关性数据分析的方法(如: 列联表分析、方差分析、线性回归和Logistic回归)、分类算法(如: 分类的基本概念、决策树算法、KNN 算法、朴素贝叶斯算法和人工神经网络)、聚类算法(如: K-means聚类算法和层次聚类算法等)和Aprior 关联规则. 除通过课堂讲授相关模型和方法的基本原理外, 还通过课程实验加深学生对这些内容的理解, 并应用处理数据、分析数据.

课程大纲
R语言基础
1.1 R安装及运行环境
1.2 数据类型及对象
1.3 数据读取和数据处理
数据分析基础
2.1 数据来源及类型
2.2 数据基础统计量
数据可视化
3.1 基于表格的数据可视化
3.2 基于图形的数据可视化
数据处理技术
4.1 数据转换
4.2 数据合并
概率与概率分布
5.1 随机事件及其概率
5.2 随机变量
5.3 由正态分布诱导的几个重要分布
统计量及其抽样分布
6.1 统计学中的基本概率
6.2 抽样分布
参数估计
7.1 参数估计的原理
7.2 总体均值的区间估计(上、下)
7.3 总体比例的区间估计
7.4 总体方差的区间估计
假设检验
8.1 假设检验的基本原理
8.2 总体均值的检验
8.3 总体比例的检验
8.4 总体方差的检验
8.5 非参数检验
列联表分析
9.1 一个类别变量的拟合优度检验
9.2 两个类别变量的独立性检验与相关性度量
方差分析
10.1 方差分析的原理
10.2 单因子方差分析
10.3 双因子方差分析
10.4 方差分析的假定及其检验
10.5 单因子方差分析的非参数方法
一元线性回归
11.1 变量间关系的度量
11.2 模型估计和检验
11.3 利用回归方程进行预测
11.4 回归分析过程示例
多元线性回归
12.1 多元线性回归模型概述
12.2 拟合优度和显著性检验
12.3 多重共线性
12.4 相对重要性和模型比较
12.5 虚拟变量回归
Logistic回归
13.1 Logistic回归的基本原理
13.2 Logistic回归实例分析
分类算法
14.1 分类的基本概念
14.2 决策树算法
14.3 KNN 算法
14.4 朴素贝叶斯算法
14.5 人工神经网络
聚类算法和关联规则
15.1 聚类的基本概念
15.2 K-means聚类算法
15.3 层次聚类算法与其他
15.4 Aprior 关联规则