数据挖掘
数据挖掘
少于1000 人选课
更新日期:2025/05/31
开课平台智慧树
开课高校青岛大学
开课教师宾晟孙更新张培俭
学科专业工学计算机类
开课时间2025/01/21 - 2025/07/20
课程周期26 周
开课状态开课中
每周学时-
课程简介
随着大数据时代的到来,面对日益庞大的数据资源,人们迫切需要强有力的工具来“挖掘”其中的有用信息。作为大数据分析技术主要组成部分----数据挖掘技术受到越来越多的重视。 数据挖掘是20世纪末兴起的数据智能分析技术,是一门汇集统计学、机器学习、数据库、人工智能等学科内容的交叉学科。数据挖掘其实是一种深层次的数据分析方法,可以描述为:按企业既定业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律性,并进一步将其模型化的先进有效的方法,即数据挖掘就是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。 本课程的特色在于由浅入深、层层推进式地介绍数据挖掘原理。通过课程的教学,使学生理解数据挖掘的重要概念和任务,掌握数据挖掘中的常用算法,为培养计算机专业高年级本科学生具备初步的科研能力和创造能力,以及进入更深入的智能数据分析研究打好基础。
课程大纲

在线教程

章节简介教学计划
大数据与数据挖掘
登录后可预览视频
大数据的产生
孙更新
什么是大数据
孙更新
大数据的特征
孙更新
大数据的应用场景
孙更新
大数据相关技术
孙更新
大数据与数据挖掘的关系
孙更新
数据预处理
数据预处理的目的
张培俭
数据清理
张培俭
数据集成和数据转换
张培俭
数据归约
数据立方体聚集
张培俭
维归约
张培俭
数据压缩
张培俭
数值归约
张培俭
数据离散化
数值数据的离散化和概念分层
张培俭
分类数据的离散化和概念分层
张培俭
特征选择与提取
张培俭
聚类分析
基本概念
宾晟
K-means算法
宾晟
K-means算法的改进
宾晟
K-中心点算法--PAM算法
宾晟
层次聚类算法
宾晟
BIRCH算法
宾晟
密度聚类算法
宾晟
分类分析
基本概念
宾晟
KNN算法
宾晟
决策树分类方法
宾晟
ID3及其改进算法
宾晟
C4.5算法
宾晟
朴素贝叶斯分类器
宾晟
规则归纳算法
宾晟
规则归纳算法实例
宾晟
关联规则挖掘
基本概念
宾晟
Apriori算法
宾晟
强关联规则的生成及综合实例
宾晟
Apriori算法的改进
宾晟
Close算法
宾晟
FP-Growth算法—建树过程
宾晟
FP-Growth算法—生成频繁项集
宾晟
序列模式挖掘
基本概念
宾晟
AprioriAll算法
宾晟
AprioriSome算法
宾晟
GSP算法
宾晟
PrefixSpan算法
宾晟
数据挖掘应用及展望
数据挖掘的应用
孙更新
数据挖掘技术展望
孙更新
  • 第一章大数据与数据挖掘

    简要介绍大数据与数据挖掘的基本概念,技术及应用

  • 1.1大数据的产生

    大数据是如何产生的

  • 1.2什么是大数据

    大数据的定义

  • 1.3大数据的特征

    大数据的特征

  • 1.4大数据的应用场景

    大数据的应用场景

  • 1.5大数据相关技术

    大数据分析中使用的技术

  • 1.6大数据与数据挖掘的关系

    大数据与数据挖掘的关系

  • 第二章数据预处理

    数据预处理包括哪些内容

  • 2.1数据预处理的目的

    数据预处理的目的是什么

  • 2.2数据清理

    数据清理相关内容

  • 2.3数据集成和数据转换

    数据集成与数据转换相关内容

  • 2.4数据归约

    数据归约相关内容

  • 2.5数据离散化

    数据离散化相关内容

  • 2.6特征选择与提取

    特征选择与提取相关内容

  • 第三章聚类分析

    聚类分析相关内容

  • 3.1基本概念

    聚类分析基本概念介绍

  • 3.2K-means算法

    K-means算法

  • 3.3K-means算法的改进

    K-means算法的改进

  • 3.4K-中心点算法--PAM算法

    PAM算法

  • 3.5层次聚类算法

    层次聚类算法

  • 3.6BIRCH算法

    BIRCH算法

  • 3.7密度聚类算法

    密度聚类算法

  • 第四章分类分析

    分类分析相关内容

  • 4.1基本概念

    分类分析基本概念

  • 4.2KNN算法

    KNN算法

  • 4.3决策树分类方法

    决策树分类算法

  • 4.4ID3及其改进算法

    ID3算法

  • 4.5C4.5算法

    C4.5算法

  • 4.6朴素贝叶斯分类器

    朴素贝叶斯分类器

  • 4.7规则归纳算法

    规则归纳算法

  • 4.8规则归纳算法实例

    规则归纳算法实例讲解

  • 第五章关联规则挖掘

    关联规则挖掘相关内容

  • 5.1基本概念

    关联规则挖掘基本概念

  • 5.2Apriori算法

    Apriori算法

  • 5.3强关联规则的生成及综合实例

    强关联规则的生成及综合实例讲解

  • 5.4Apriori算法的改进

    Apriori算法的改进

  • 5.5Close算法

    Close算法

  • 5.6FP-Growth算法—建树过程

    FP-Growth算法—建树过程讲解

  • 5.7FP-Growth算法—生成频繁项集

    FP-Growth算法—生成频繁项集过程讲解

  • 第六章序列模式挖掘

    序列模式挖掘相关内容

  • 6.1基本概念

    序列模式挖掘基本概念

  • 6.2AprioriAll算法

    AprioriAll算法

  • 6.3AprioriSome算法

    AprioriSome算法

  • 6.4GSP算法

    GSP算法

  • 6.5PrefixSpan算法

    PrefixSpan算法

  • 第七章数据挖掘应用及展望

    数据挖掘应用及展望

  • 7.1数据挖掘的应用

    数据挖掘的应用

  • 7.2数据挖掘技术展望

    数据挖掘技术展望

  • 开始学习
  • 第一章  作业测试
    第一章 大数据与数据挖掘

    1.1 大数据的产生

    1.2 什么是大数据

    1.3 大数据的特征

    1.4 大数据的应用场景

    1.5 大数据相关技术

    1.6 大数据与数据挖掘的关系

    视频数6
  • 第二章  作业测试
    第二章 数据预处理

    2.1 数据预处理的目的

    2.2 数据清理

    2.3 数据集成和数据转换

    2.4 数据归约

    2.5 数据离散化

    2.6 特征选择与提取

    视频数10
  • 第三章  作业测试
    第三章 聚类分析

    3.1 基本概念

    3.2 K-means算法

    3.3 K-means算法的改进

    3.4 K-中心点算法--PAM算法

    3.5 层次聚类算法

    3.6 BIRCH算法

    3.7 密度聚类算法

    视频数7
  • 第四章  作业测试
    第四章 分类分析

    4.1 基本概念

    4.2 KNN算法

    4.3 决策树分类方法

    4.4 ID3及其改进算法

    4.5 C4.5算法

    4.6 朴素贝叶斯分类器

    4.7 规则归纳算法

    4.8 规则归纳算法实例

    视频数8
  • 第五章  作业测试
    第五章 关联规则挖掘

    5.1 基本概念

    5.2 Apriori算法

    5.3 强关联规则的生成及综合实例

    5.4 Apriori算法的改进

    5.5 Close算法

    5.6 FP-Growth算法—建树过程

    5.7 FP-Growth算法—生成频繁项集

    视频数7
  • 第六章  作业测试
    第六章 序列模式挖掘

    6.1 基本概念

    6.2 AprioriAll算法

    6.3 AprioriSome算法

    6.4 GSP算法

    6.5 PrefixSpan算法

    视频数5
  • 第七章  作业测试
    第七章 数据挖掘应用及展望

    7.1 数据挖掘的应用

    7.2 数据挖掘技术展望

    视频数2
  • 期末考试