金融数据挖掘是一门融合“金融”加“数据挖掘算法”的前沿交叉课程,关注数据挖掘算法和复杂金融场景、实现数据挖掘技术赋能智能金融、培养具有爱国情怀的金融科技人才。课程对标金融市场、金融机构、政府机构、公司金融等复杂金融场景,挖掘金融实际需求,主要涵盖以下四个主题:金融大数据描述,金融大数据预测,金融大数据复杂关系分析,金融大数据异常检测分析四个主要模块。在深入介绍金融大数据的基础上,课程结合金融大数据预测需求与分类算法,金融大数据复杂关系分析与关联分析算法,金融大数据异常检测需求与聚类算法,探讨数据挖掘算法赋能智能金融的思想、步骤、评估与创新。
第一章 绪论
了解什么是数据挖掘;学习数据挖掘的意义;理解数据挖掘的任务;了解数据挖掘在金融领域的应用
课时:
1.1 What is Data Mining?
1.2 How Data Mining Works in Financial Area?
第二章 数据
了解什么是数据;掌握数据类型与数据质量;理解数据预处理的意义;掌握相似性和相异性的度量方法
课时:
2.1 What is data(1)?
2.2 What is data(2)?
2.3 Data pre-processing(1)
2.4 Data pre-processing(2)
2.5 Similarity and Dissimilarity of data(1)
2.6 Similarity and Dissimilarity of data(2)
2.7 Similarity and Dissimilarity of data(3)
第三章 分类——决策树分类器
了解什么是分类;理解决策树分类器的原理;掌握不同决策树分类算法的实现过程
课时:
3.1 Classification-basic concept and idea
3.2 Introduction to Decision Tree Classifier
3.3 Methods for Expressing Attribute Test Conditions
3.4 Measures of Impurity
3.5 An Example to Compute a Decision Tree
第四章 分类——基于规则的分类器
了解什么是基于规则的分类器;理解基于规则的分类器的原理;掌握基于规则的分类算法的实现过程
课时:
4.1 Introduction to Rule-Based Classifier
4.2 Direct Method for Rule Extraction
4.3 An Example to Build Rule-Based Classifier
第五章 分类——朴素贝叶斯分类器
了解什么是朴素贝叶斯分类器;理解朴素贝叶斯分类器的原理;掌握朴素贝叶斯分类算法的计算过程
课时:
5.1 Introduction to Naive Bayes Classifier
5.2 An Example to Build Naive Bayes Classifier
第六章 分类——贝叶斯信念网络分类器
了解什么是贝叶斯信念网络分类器;理解贝叶斯信念网络分类器的原理;掌握贝叶斯信念网络分类算法的计算过程
课时:
6.1 Introduction to Bayesian Belief Networks
6.2 An Example of Bayesian Belief Networks
第七章 拟合不足和过拟合
了解什么是分类中的拟合不足和过拟合;理解拟合不足和过拟合的产生原因;掌握泛化误差的估计;了解拟合不足和过拟合的解决方法
课时:
7.1 Underfitting and Overfitting (1)
7.2 Underfitting and Overfitting (2)
第八章 分类-模型评估和比较
了解什么是分类模型的评估和比较;掌握分类模型的评估指标及其计算过程;掌握分类模型的比较方法
课时:
8.1 Classification-Model Evaluation
8.2 Classification-Model Comparison
第九章 关联分析-Apriori算法
了解什么是关联分析;了解什么是Apriori算法;理解Apriori算法的原理;掌握Apriori算法的实现过程
课时:
9.1 Association Analysis-basic concept and idea
9.2 Apriori Algorithm (1)-Introduction
9.3 Apriori Algorithm (2)-Candidate Generation & Pruning
9.4 Apriori Algorithm (3)-Hash Tree
9.5 Apriori Algorithm (4)-Rule Generation and Complexity
第十章 关联分析-FP树增长算法
了解什么是FP树增长算法;理解FP树增长算法的原理;掌握FP树增长算法的实现过程
课时:
10.1 FP Tree Algorithm-Introduction
10.2 FP Tree Algorithm-An Example
第十一章 关联分析-关联模式评估
了解什么是关联模式评估;掌握关联模式的客观度量方法及计算过程;理解关联模式客观度量方法的一致性问题和性质
课时:
11.1 Association Analysis-Evaluation (1)
11.2 Association Analysis-Evaluation (2)
第十二章 聚类分析-k-means算法
了解什么是聚类分析;了解什么是k-means算法;理解k-means算法的原理;掌握k-means算法的实现过程
课时:
12.1 Cluster Analysis-basic concept and idea
12.2 Introduction to K-means Algorithm
第十三章 聚类分析-基本层次聚类算法
了解什么是基本凝聚层次聚类算法;理解基本凝聚层次聚类算法的原理;掌握基本凝聚层次聚类算法的实现过程
课时:
13.1 Introduction to Agglomerative Hierarchical Clustering Algorithm
13.2 An Example of Agglomerative Hierarchical Clustering Algorithm
第十四章 聚类分析-簇评估
了解什么是簇评估;掌握无监督簇评估;掌握有监督簇评估
课时:
14.1 Unsupervised Cluster Evaluation
14.2 Supervised Cluster Evaluation