【教学模式】
课程主要采用课堂讲授与课程实验的混合教学模式. 课堂主要讲授数据分析的基本工具、基本原理和基本方法, 旨在帮助学生构建数据分析的基本思维, 掌握数据分析的基本流程. 课程实验主要通过数据分析实验训练学生实际动手能力, 旨在帮助学生掌握R语言, 并能够处理数据, 实现数据的可视化和统计建模.
【课程内容】
课程内容主要包括三个部分: R语言基础、数据分析基础,及统计方法与数据挖掘算法, 共15章内容. R语言基础主要讲授R语言的运行环境、R语言的语法、数据处理和数据可视化; 数据分析基础则主要讲授统计的基本概念、区间估计和假设检验; 统计方法与数据挖掘算法主要讲授相关性数据分析的方法(如: 列联表分析、方差分析、线性回归和Logistic回归)、分类算法(如: 分类的基本概念、决策树算法、KNN 算法、朴素贝叶斯算法和人工神经网络)、聚类算法(如: K-means聚类算法和层次聚类算法等)和Aprior 关联规则. 除通过课堂讲授相关模型和方法的基本原理外, 还通过课程实验加深学生对这些内容的理解, 并应用处理数据、分析数据.