数据不仅限于计算机科学和电子学领域,各个领域的应用在某种程度上使用并产生了数据。在当今数字经济时代,数据就是生产力,数据分析对企业和整个社会的作用越发重要。数据人才也成为了社会急需的紧缺人才。数据科学通过对数据源进行系统地研究和分析,理解数据的含义,并运用数据作为工具实现有效的决策制定和问题求解。课程涵盖的知识模块包括数据科学概述、数据科学中的数学基础、Matlab基础程序、数据可视化、数据分析专题五大模块。通过课程学习,掌握数据分析的基本流程与基本方法。
课程内容以模块化案例教学开展,课程内容结合理工类专业学科特点,以Matlab软件为工具,从数据、任务、领域三个维度构建案例,在讲解案例或实践案例中,引入多种类型的数据,针对分类、聚类、关联规则、数据异常检测和可视化等五大分析任务分别展开,各有侧重有相互融合。
数据科学概论
1-1信息文明与数据简史
1-2应用案例与价值
1-3数据驱动的问题求解过程
单元测验一
单元作业一
数据科学中的数学基础
2-1主要数学对象
2-2数学对象的基本运算
2-3数学对象的属性
2-4函数特性与推广
2-5概率与统计
单元测验二
单元作业二
Matlab程序设计基础
3-1Matlab脚本文件
3-2程序控制结构之顺序结构
3-3程序控制结构之选择结构
3-4程序控制结构之循环结构
3-5Matlab中的函数
3-6向量化编程
单元作业三
单元测验三
Matlab数据可视化
4-1数据可视化概论
4-2Matlab绘图模型
4-3二维空间中的数据可视化
4-4三维空间中的数据可视化
4-5三维绘图中的视角、光照
4-6动画
单元作业四
单元测验四
数据探索性分析
5-1数据分析的流程
5-2探索性分析
5-3探索性分析案例
单元测验五
单元作业五
数据回归
6-1相关与回归概述
6-2一元线性回归
6-3多元线性回归与多项式回归
6-4非线性回归与模型选择
6-5回归工具箱
单元测验六
单元作业六
数据分类
7-1分类问题概述
7-2KNN分类
7-3分类器的比较和评估
7-4支持向量机分类
7-5分类工具箱
单元测验七
单元作业七
数据聚类
8-1聚类概述
8-2谱系聚类
8-3K-Means聚类
8-4聚类的有效性
单元测验八
单元作业八
关联规则分析
9-1关联规则概述
9-2关联规则算法
9-3关联规则应用案例
单元测验九
单元作业九