Python数据挖掘
Python数据挖掘
1000+ 人选课
更新日期:2025/07/07
开课平台智慧树
开课高校青岛大学
开课教师王常颖陈宇
学科专业工学计算机类
开课时间2025/01/21 - 2025/07/20
课程周期26 周
开课状态开课中
每周学时-
课程简介
零基础带你踏上Python数据挖掘之旅,以大数据分析师的视角看世界!
课程大纲

在线教程

章节简介教学计划
Python简介与基本数据类型
登录后可预览视频
Python简介与基本数据类型
王常颖
整型等基本数据类型
王常颖
浮点型等数据类型
王常颖
赋值运算符
王常颖
逻辑运算符
王常颖
math数学库
王常颖
内置数学函数
王常颖
分支结构
单分支双分支结构
王常颖
多分支结构
王常颖
while循环结构
while循环基本结构
王常颖
while循环应用实例
王常颖
break与continue
王常颖
for循环结构
for循环range函数
王常颖
for循环应用实例
王常颖
函数的定义
函数的定义
王常颖
判断整数是否为回文素数
王常颖
函数的定义形式
王常颖
函数的调用
王常颖
函数的参数
必备参数与哥德巴赫猜想
王常颖
默认值参数
王常颖
键值参数
王常颖
模块化程序设计
什么是模块化程序设计
王常颖
模块化程序设计示例
王常颖
模块化程序设计的引用
王常颖
递归函数
递归函数定义形式
王常颖
递归函数简单示例
王常颖
字符串
字符串的访问
王常颖
字符串中字符替换示例
王常颖
转义字符
王常颖
字符串的分割函数
王常颖
字符串中大小写字母转换
王常颖
去掉字符串中多余的空格
王常颖
字符串比较大小
王常颖
列表
列表的定义与访问
王常颖
列表作为函数参数
王常颖
列表相关的函数
王常颖
元组与集合
什么是元组
王常颖
可变长度参数
王常颖
集合的定义与访问
王常颖
集合的应用实例与子集
王常颖
字典
字典的定义
王常颖
字典的赋值
王常颖
字典访问函数
王常颖
文件
文件1
王常颖
文件2
王常颖
文件3
王常颖
Python数据分析常用库
Jupyter notebook简介
陈宇
NumPy库
陈宇
Pandas库
陈宇
Pandas数据处理
陈宇
Matplotlib库
陈宇
Scipy库
陈宇
Python数据读取
PyCharm环境安装
王常颖
从文件中读取数据
王常颖
数据预处理Python实践
数据预处理
王常颖
缺失值填充
王常颖
关联规则挖掘与Python实践
什么是关联规则挖掘
王常颖
关联规则挖掘思路
王常颖
Apriori算法
王常颖
关联规则挖掘的Python实践
王常颖
决策树分类分析与Python实践
什么是分类分析
王常颖
决策树分类的基本思想
王常颖
ID3决策树算法
王常颖
决策树算法的优劣
王常颖
C4.5分类算法原理
王常颖
C4.5算法处理连续属性
王常颖
C4.5算法处理缺失值
王常颖
决策树的Python实践
王常颖
随机森林与Python实践
随机森林基本思想
王常颖
随机森林CART算法
王常颖
随机森林的投票机制
王常颖
随机森林的Python实践
王常颖
随机森林模型训练与预测
王常颖
交叉验证
王常颖
朴素贝叶斯与Python实践
朴素贝叶斯算法
王常颖
sklearn中朴素贝叶斯模型简介
王常颖
朴素贝叶斯的Python实践
王常颖
Kmeans划分聚类与Python实践
聚类分析的基本思想
王常颖
相似性测量方法
王常颖
Kmeans算法
王常颖
Kmeans类介绍
王常颖
Kmeans聚类Python实践
王常颖
Birch层次聚类与Python实践
什么是层次聚类
王常颖
Birch算法原理
王常颖
Birch层次聚类示例
王常颖
Birch层次聚类Python实践
王常颖
DBSCAN密度聚类与Python实践
密度聚类算法原理
王常颖
DBSCAN算法
王常颖
DBSCAN算法示例
王常颖
DBSCAN算法优缺点
王常颖
DBSCAN密度聚类Python实践
王常颖
OPTICS密度聚类与Python实践
OPTICS密度聚类算法思想
王常颖
OPTICS算法示例-1
王常颖
OPTICS算法示例-2
王常颖
OPTICS算法描述
王常颖
OPTICS密度聚类Python实践
王常颖
OPTICS密度聚类的可达距离图绘制
  • 第一部分Python简介与基本数据类型

    数据科学概述,数据科学的组成部分与常用的数据处理方法、工具;Python语言简介,Python在数据科学中的应用领域。

  • 1.1Python简介与基本数据类型

    给出Python简介以及基本的数据类型介绍。

  • 1.2整型等基本数据类型

    介绍整型、字符串型等基本数据类型。

  • 1.3浮点型等数据类型

    介绍浮点型、布尔型、复数型等数据类型。

  • 1.4赋值运算符

    介绍赋值运算符、数学运算符、成员运算符等内容。

  • 1.5逻辑运算符

    介绍逻辑运算符。

  • 1.6math数学库

    介绍math库中的函数与常量等。

  • 1.7内置数学函数

    介绍Python内置数学函数。

  • 第二部分分支结构

    介绍if...else...分支结构的使用。

  • 2.1单分支双分支结构

    介绍if单独使用,以及if...else搭配使用方式。

  • 2.2多分支结构

    介绍if...elif...else结构的多分支结构的使用方式。

  • 第三部分while循环结构

    介绍如何使用while循环编程。

  • 3.1while循环基本结构

    介绍循环的基本结构。

  • 3.2while循环应用实例

    以几个简单的示例讲解如何使用while循环。

  • 3.3break与continue

    以简单的示例讲解break与continue的用法与区别。

  • 第四部分for循环结构

    讲解for循环的基本形式,以及一些简单的应用示例。

  • 4.1for循环range函数

    介绍for循环以及经常与for循环搭配使用的range函数。

  • 4.2for循环应用实例

    讲解for循环的应用示例。

  • 第五部分函数的定义

    介绍函数的定义形式,函数的参数,返回值等相关内容。

  • 5.1函数的定义

    介绍函数定义的形式。

  • 5.2判断整数是否为回文素数

    用判断是否是回文素数来让学生理解使用函数的优势。

  • 5.3函数的定义形式

    给出函数的严格定义形式,以及以实例的方式演示如何使用函数。

  • 5.4函数的调用

    介绍函数调用的时候参数是如何传递的。

  • 第六部分函数的参数

    介绍函数的参数可以是哪些类型。

  • 6.1必备参数与哥德巴赫猜想

    介绍具备必备参数的函数是如何定义与使用的。

  • 6.2默认值参数

    介绍具有默认值参数的函数是如何定义与使用的。

  • 6.3键值参数

    介绍具备键值参数的函数是如何定义与使用的。

  • 第七部分模块化程序设计

    介绍如何采用模块化程序设计进行编程。

  • 7.1什么是模块化程序设计

    介绍什么是模块化程序设计。

  • 7.2模块化程序设计示例

    以一个实例来介绍模块化程序设计的流程。

  • 7.3模块化程序设计的引用

    如何制作能够被引用的模块。

  • 第八部分递归函数

    介绍如何使用递归函数的思想来设计递归函数程序。

  • 8.1递归函数定义形式

    介绍递归函数的基本形式。

  • 8.2递归函数简单示例

    从简单的示例来介绍递归函数如何构造。

  • 第九部分字符串

    介绍字符串数据类型,以及可使用的相关函数。

  • 9.1字符串的访问

    介绍如何访问字符串中的字符与子串。

  • 9.2字符串中字符替换示例

    介绍如何实现字符串中子串的替换。

  • 9.3转义字符

    介绍转义字符的含义,以及如何实现去除转义字符的含义。

  • 9.4字符串的分割函数

    介绍用于分割字符串的相关函数。

  • 9.5字符串中大小写字母转换

    介绍如何将字符串中的大小写字母相互转换。

  • 9.6去掉字符串中多余的空格

    介绍如何去掉字符串中多余的空格的相关函数。

  • 9.7字符串比较大小

    介绍字符串之间如何比较大小。

  • 第十部分列表

    介绍列表数据类型,以及可以使用的函数。

  • 10.1列表的定义与访问

    介绍什么是列表,以及如何访问列表中的元素。

  • 10.2列表作为函数参数

    介绍如何编写以列表为参数的函数。

  • 10.3列表相关的函数

    介绍列表适用的函数是如何使用的。

  • 第十一部分元组与集合

    介绍元组与集合两种数据类型,以及常用函数。

  • 11.1什么是元组

    介绍什么是元组数据类型,以及与列表的差别。

  • 11.2可变长度参数

    介绍如何使用可变长参数设计函数。

  • 11.3集合的定义与访问

    介绍什么是集合,以及适用于集合的函数。

  • 11.4集合的应用实例与子集

    介绍集合的子集方法。

  • 第十二部分字典

    介绍字典数据类型,以及字典的访问方式。

  • 12.1字典的定义

    介绍什么是字典数据类型。

  • 12.2字典的赋值

    介绍如何对字典进行赋值。

  • 12.3字典访问函数

    介绍适用于字典数据类型的访问函数。

  • 第十三部分文件

    介绍文件的读取操作。

  • 13.1文件1

    文件的读取实例。

  • 13.2文件2

    文件的读取实例。

  • 13.3文件3

    文件的读取实例。

  • 第十四部分Python数据分析常用库

    介绍Python的常用库。

  • 14.1Jupyter notebook简介

    介绍Jupyter notebook是什么,如何使用。

  • 14.2NumPy库

    介绍Numpy库的使用方式。

  • 14.3Pandas库

    介绍Scipy库的使用方式。

  • 14.4Pandas数据处理

    介绍Pandas库的使用方式。

  • 14.5Matplotlib库

    介绍如何使用Pandas进行数据处理。

  • 14.6Scipy库

    介绍Matplotlib库的使用方式。

  • 第十五部分Python数据读取

    介绍Pycharm环境的安装,以及如何从文件中读取数据。

  • 15.1PyCharm环境安装

    介绍Pycharm环境的安装过程。

  • 15.2从文件中读取数据

    介绍从excel与文本文件中读取数据的方式。

  • 第十六部分数据预处理Python实践

    介绍如何使用Pandas进行数据预处理。

  • 16.1数据预处理

    介绍数据预处理需要的过程,以及实现方法。

  • 16.2缺失值填充

    介绍数据清洗方法及其实现方法。

  • 第十七部分关联规则挖掘与Python实践

    介绍关联规则挖掘的基本思想,基本算法,以及Python实践方法。

  • 17.1什么是关联规则挖掘

    介绍了关联规则挖掘的社会需求,挖掘步骤,挖掘思想。

  • 17.2关联规则挖掘思路

    介绍了最经典的关联规则挖掘算法——Apriori算法的原理、计算实例。

  • 17.3Apriori算法

    介绍了Apriori算法的优势与局限性,并针对局限性,介绍了几种改进的策略。

  • 17.4关联规则挖掘的Python实践

    介绍如何使用Python语言进行关联规则挖掘。

  • 第十八部分决策树分类分析与Python实践

    介绍分类分析的基本思想,决策树分类算法及其Python实践方法。

  • 18.1什么是分类分析

    介绍了分类分析的社会需求,以及分类分析适合解决的问题。

  • 18.2决策树分类的基本思想

    介绍了分类分析的算法原理,并以一个简单的算法示例介绍决策树分类的整个流程。

  • 18.3ID3决策树算法

    以一个实际的应用示例,介绍了最经典的ID3决策树算法,介绍了信息增益的概念,介绍了决策树的构建过程。

  • 18.4决策树算法的优劣

    介绍了ID3决策树算法的优势与局限性,引出下一步探索思路。

  • 18.5C4.5分类算法原理

    针对ID3决策树算法不能处理连续属性,以及信息增益衡量指标的局限性,提出了信息增益比的测算指标,并且能够处理连续属性的C4.5决策树分类算法。

  • 18.6C4.5算法处理连续属性

    以一个连续属性为例,介绍了C4.5算法处理连续属性的流程。

  • 18.7C4.5算法处理缺失值

    以一个简单的示例,介绍C4.5算法处理缺失值的计算流程。

  • 18.8决策树的Python实践

    介绍如何使用Python进行决策树构建。

  • 第十九部分随机森林与Python实践

    介绍随机森林算法,以及如何使用Python语言进行实践。

  • 19.1随机森林基本思想

    介绍随机森林算法的基本思想。

  • 19.2随机森林CART算法

    介绍CART二叉树生成算法。

  • 19.3随机森林的投票机制

    介绍随机森林的投票机制。

  • 19.4随机森林的Python实践

    介绍随机森林的Python实践。

  • 19.5随机森林模型训练与预测

    介绍如何使用随机森林模型进行训练与预测。

  • 19.6交叉验证

    介绍如何使用Python进行交叉验证,评估模型精度。

  • 第二十部分朴素贝叶斯与Python实践

    介绍朴素贝叶斯基本原理与算法,以及采用Python语言的实践。

  • 20.1朴素贝叶斯算法

    介绍朴素贝叶斯算法。

  • 20.2sklearn中朴素贝叶斯模型简介

    讲解如何用Python语言进行朴素贝叶斯分类。

  • 20.3朴素贝叶斯的Python实践

    介绍高斯朴素贝叶斯的实现方式。

  • 第二十一部分Kmeans划分聚类与Python实践

    介绍Kmean算法的基本思想、算法,以及Python实践方法。

  • 21.1聚类分析的基本思想

    介绍聚类分析的基本思想。

  • 21.2相似性测量方法

    介绍相似性测量方式。

  • 21.3Kmeans算法

    介绍Kmeans算法的基本原理以及适用范围。

  • 21.4Kmeans类介绍

    介绍sklearn中的Kmeans类。

  • 21.5Kmeans聚类Python实践

    介绍如何使用Python开展朴素贝叶斯分类。

  • 第二十二部分Birch层次聚类与Python实践

    介绍层次聚类的基本思想,BIRCH算法,以及Python的实践方式。

  • 22.1什么是层次聚类

    介绍什么是层次聚类。

  • 22.2Birch算法原理

    介绍BIRCH算法的基本原理。

  • 22.3Birch层次聚类示例

    讲解一个采用BIRCH算法的应用实例。

  • 22.4Birch层次聚类Python实践

    介绍如何使用Python进行层次聚类实践。

  • 第二十三部分DBSCAN密度聚类与Python实践

    介绍密度聚类的适用范围,DBSCAN算法,以及Python实践方法。

  • 23.1密度聚类算法原理

    介绍密度聚类算法的原理以及适用范围。

  • 23.2DBSCAN算法

    介绍DBSCAN算法思想。

  • 23.3DBSCAN算法示例

    讲解一个DBSCAN算法的实例。

  • 23.4DBSCAN算法优缺点

    介绍DBSCAN算法的优缺点。

  • 23.5DBSCAN密度聚类Python实践

    介绍DBSCAN算法的Python实现过程。

  • 第二十四部分OPTICS密度聚类与Python实践

    介绍OPTICS密度聚类算法的基本思想,以及如何使用Python进行实践。

  • 24.1OPTICS密度聚类算法思想

    介绍了OPTICS密度聚类的基本思想,介绍了核心距离、可达距离等概念。

  • 24.2OPTICS算法示例-1

    以一个数据集为例,介绍OPTICS算法的运行过程,这里展示该示例的前半部分。

  • 24.3OPTICS算法示例-2

    接着上一节内容,以一个数据集为例,介绍OPTICS算法的运行过程,讲解示例的后半部分。

  • 24.4OPTICS算法描述

    介绍OPTICS算法的伪代码描述方式。

  • 24.5OPTICS密度聚类Python实践

    以一个实际的案例为例,讲解采用Python语言实现基于OPTICS的密度聚类的过程。

  • 24.6OPTICS密度聚类的可达距离图绘制

    以一个实际的案例为例,讲解采用Python语言实现密度聚类结果的可视化的过程。

  • 开始学习
  • 第一部分  作业测试
    第一部分 Python简介与基本数据类型

    1.1 Python简介与基本数据类型

    1.2 整型等基本数据类型

    1.3 浮点型等数据类型

    1.4 赋值运算符

    1.5 逻辑运算符

    1.6 math数学库

    1.7 内置数学函数

    视频数7
  • 第二部分  作业测试
    第二部分 分支结构

    2.1 单分支双分支结构

    2.2 多分支结构

    视频数2
  • 第三部分  作业测试
    第三部分 while循环结构

    3.1 while循环基本结构

    3.2 while循环应用实例

    3.3 break与continue

    视频数3
  • 第四部分  作业测试
    第四部分 for循环结构

    4.1 for循环range函数

    4.2 for循环应用实例

    视频数2
  • 第五部分  作业测试
    第五部分 函数的定义

    5.1 函数的定义

    5.2 判断整数是否为回文素数

    5.3 函数的定义形式

    5.4 函数的调用

    视频数4
  • 第六部分  作业测试
    第六部分 函数的参数

    6.1 必备参数与哥德巴赫猜想

    6.2 默认值参数

    6.3 键值参数

    视频数3
  • 第七部分  作业测试
    第七部分 模块化程序设计

    7.1 什么是模块化程序设计

    7.2 模块化程序设计示例

    7.3 模块化程序设计的引用

    视频数3
  • 第八部分  作业测试
    第八部分 递归函数

    8.1 递归函数定义形式

    8.2 递归函数简单示例

    视频数2
  • 第九部分  作业测试
    第九部分 字符串

    9.1 字符串的访问

    9.2 字符串中字符替换示例

    9.3 转义字符

    9.4 字符串的分割函数

    9.5 字符串中大小写字母转换

    9.6 去掉字符串中多余的空格

    9.7 字符串比较大小

    视频数7
  • 第十部分  作业测试
    第十部分 列表

    10.1 列表的定义与访问

    10.2 列表作为函数参数

    10.3 列表相关的函数

    视频数3
  • 第十一部分  作业测试
    第十一部分 元组与集合

    11.1 什么是元组

    11.2 可变长度参数

    11.3 集合的定义与访问

    11.4 集合的应用实例与子集

    视频数4
  • 第十二部分  作业测试
    第十二部分 字典

    12.1 字典的定义

    12.2 字典的赋值

    12.3 字典访问函数

    视频数3
  • 第十三部分  作业测试
    第十三部分 文件

    13.1 文件1

    13.2 文件2

    13.3 文件3

    视频数3
  • 第十四部分  作业测试
    第十四部分 Python数据分析常用库

    14.1 Jupyter notebook简介

    14.2 NumPy库

    14.3 Pandas库

    14.4 Pandas数据处理

    14.5 Matplotlib库

    14.6 Scipy库

    视频数6
  • 第十五部分  作业测试
    第十五部分 Python数据读取

    15.1 PyCharm环境安装

    15.2 从文件中读取数据

    视频数2
  • 第十六部分  作业测试
    第十六部分 数据预处理Python实践

    16.1 数据预处理

    16.2 缺失值填充

    视频数2
  • 第十七部分  作业测试
    第十七部分 关联规则挖掘与Python实践

    17.1 什么是关联规则挖掘

    17.2 关联规则挖掘思路

    17.3 Apriori算法

    17.4 关联规则挖掘的Python实践

    视频数4
  • 第十八部分  作业测试
    第十八部分 决策树分类分析与Python实践

    18.1 什么是分类分析

    18.2 决策树分类的基本思想

    18.3 ID3决策树算法

    18.4 决策树算法的优劣

    18.5 C4.5分类算法原理

    18.6 C4.5算法处理连续属性

    18.7 C4.5算法处理缺失值

    18.8 决策树的Python实践

    视频数8
  • 第十九部分  作业测试
    第十九部分 随机森林与Python实践

    19.1 随机森林基本思想

    19.2 随机森林CART算法

    19.3 随机森林的投票机制

    19.4 随机森林的Python实践

    19.5 随机森林模型训练与预测

    19.6 交叉验证

    视频数6
  • 第二十部分  作业测试
    第二十部分 朴素贝叶斯与Python实践

    20.1 朴素贝叶斯算法

    20.2 sklearn中朴素贝叶斯模型简介

    20.3 朴素贝叶斯的Python实践

    视频数3
  • 第二十一部分  作业测试
    第二十一部分 Kmeans划分聚类与Python实践

    21.1 聚类分析的基本思想

    21.2 相似性测量方法

    21.3 Kmeans算法

    21.4 Kmeans类介绍

    21.5 Kmeans聚类Python实践

    视频数5
  • 第二十二部分  作业测试
    第二十二部分 Birch层次聚类与Python实践

    22.1 什么是层次聚类

    22.2 Birch算法原理

    22.3 Birch层次聚类示例

    22.4 Birch层次聚类Python实践

    视频数4
  • 第二十三部分  作业测试
    第二十三部分 DBSCAN密度聚类与Python实践

    23.1 密度聚类算法原理

    23.2 DBSCAN算法

    23.3 DBSCAN算法示例

    23.4 DBSCAN算法优缺点

    23.5 DBSCAN密度聚类Python实践

    视频数5
  • 第二十四部分  作业测试
    第二十四部分 OPTICS密度聚类与Python实践

    24.1 OPTICS密度聚类算法思想

    24.2 OPTICS算法示例-1

    24.3 OPTICS算法示例-2

    24.4 OPTICS算法描述

    24.5 OPTICS密度聚类Python实践

    24.6 OPTICS密度聚类的可达距离图绘制

    视频数6
  • 期末考试