随着计算方法和信息技术的不断发展,大量数据的产生和收集导致信息爆炸,而信息可以产生价值,因而需要我们对这些数据进行实时和深层次的分析。商业智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。为了将数据转化为知识,需要利用数据仓库、联机分析处理(OLAP)工具和数据挖掘等技术。本课程将介绍这三方面技术背景,并通过一系列实验综合运用这些技术。学生只需要有基本的数据库知识,不需要掌握编程语言,通过课程学习引导学生对数据挖掘产生兴趣,并且逐渐培养学生的数据意识,对较为成熟的技术和方法具有相应的分析应用能力。并为以后深入学习打下基础。
本课程内容共11周,分为两部分:概念和实践。概念4周,实践7周。具体内容如下:
第一部分,共4周:讲解课程涉及的基本概念,包括:导论、数据挖掘定义、数据挖掘分类、判断挖掘问题类型、基本数据挖掘技术、数据仓库原理、数据预处理。
第二部分,共7周 :其中5周讲解经典数据挖掘算法应用案例。算法包括:决策树、贝叶斯、聚类、关联规则、神经网络、逻辑回归、时间序列、序列聚类。另外2周讲解OLAP应用,涉及多维数据集的创建和维护方法,最后使用它进行多维数据分析。
本课程实验环境使用SQLServer Analysis Services。
第一周 第1章 导论&第2章 数据挖掘简介
1-1 商业智能
1-2 数据仓库
1-3 数据挖掘
2-1 数据挖掘是怎样工作的
2-2 数据挖掘还是数据查询
2-3 数据挖掘的功能
第一周 基本概念小测
第2周 第3章 数据挖掘的主要方法
3-1 决策树
3-2 关联规则
3-3 K-平均值算法
3-4 遗传学习
3-5 神经网络
第二周小测
第3周 第4章 数据仓库
4-1 数据仓库的定义
4-2 数据仓库的结构
4-3 数据仓库系统的设计
第4周 数据挖掘实战(1)
DM-1 基于SQLServer的数据分析环境
DM-2 决策树算法应用场景
DM-3 决策树算法应用示例
决策树算法应用上机实践
第5周 数据挖掘实战(2)
DM-4 贝叶斯算法应用场景与示例
DM-5 神经网络算法应用场景与示例
DM-6 逻辑回归算法应用场景与示例
第5周小测
第6周 数据挖掘实战(3)
DM-7 聚类算法应用场景与示例
DM-8 关联规则算法应用场景
DM-9 关联规则算法应用示例
第7周 数据挖掘实战(4)
DM-10 顺序分析和聚类分析算法应用场景
DM-11 顺序分析和聚类分析算法应用示例
第8周 数据挖掘实战(5)
DM-12 时序算法应用场景
DM-13 时序算法应用示例
第9周 OLAP实战(1)
OLAP-1 多维数据分析简介
OLAP-2 数据源视图和多维数据集的创建
OLAP-3 多维数据集的部署和浏览
OLAP-4修改度量值、属性和层次结构
第9周小测
第10周 OLAP实战(2)
OLAP-5 定义高级属性和维度属性
OLAP-6 定义计算、维度和度量值组之间的关系
OLAP-7定义钻取操作、透视、翻译
第11周 数据预处理
数据预处理的必要性
数据清洗
数据集成
数据转换等
数据预处理