机器学习
机器学习
1000+ 人选课
更新日期:2025/05/25
开课时间2025/02/17 - 2025/06/27
课程周期19 周
开课状态开课中
每周学时-
课程简介

课程内容安排

本课程是机器学习的一个入门级课程,系统的介绍了常用算法的思想、以及数据建模的整个流程(包括数据的收集处理、模型的建立、模型选择与模型诊断、模型的改进策略等),同时介绍了Python基本语法、面向对象编程以及常用算法的代码实现。主要面向对数据分析感兴趣的本科生、研究生及数据科学爱好者。

课程一共12章,其中,第1-2, 5-7,10-12章主要以吴恩达老师的Coursera《Machine Learning》讲稿为主要内容;第6章部分内容参考了李沐老师的《动手学深度学习》教材;第3-4,8-9章是课程组自编讲义(第8-9章部分内容参考了周志华老师的《机器学习》教材)。

 

 课程的特点

1 课程内容的安排具有较强的递进式,除第3-4章相对独立外,其他章节建议按顺序学习,以确保课程的完整性。

2 每节教学视频力争在较短的时长,传达一个算法或概念的本质思想(因此对于初学者有些计算细节需要大家结合课件PPT自行完成推导)。

3 同时重视机器学习和Python语言入门教学。

4 机器学习教学注重对处理数据的理念以及不同算法思想的内在联系的理解。

 

本课程适用的对象及使用建议


(1)零基础的同学,想比较规范、系统的入门机器学习课程。

(2)之前接触过机器学习或数据挖掘,但没有形成系统性知识架构。

(3) 已具有系统的数理统计知识体系,希望重塑机器学习的观点,但又不想在课堂学习上花大量的时间。

对于第一种情形,建议每个教学视频多看一遍,每次学习1-2个视频为佳,理解好整个知识脉络,以及细节推导。

对于第二、三种情形,可以快速学习,也就是说您可以通过3个小时,迅速的重构整个机器学习知识体系 (除3、4章python实现部分,其余的视频时长3个小时),避免了大量的冗余课堂学习。

对于没有编程基础的同学,第3、4章需要多花时间练习,如果对Python实现不感兴趣的同学,这部分可以跳过。此外,第9章的KKT条件和再生核希尔伯特空间涉及到凸优化和泛函分析的知识,对本科生可仅作了解。

课程大纲
机器学习引论
1.1机器学习简介
1.2有监督学习与无监督学习
线性回归
2.1单变量线性回归
2.2梯度下降
2.3多变量线性回归
2.4多项式回归与正则方程
Python基本语法
3.1Python标准数据类型
3.2python常用函数
3.3科学计算库Numpy
3.4简单作图与控制流语句
3.5Pandas简介
线性模型的Python实现与面向对象编程
4.1向量化表示编程
4.2线性模型的代码实现
4.3类与面向对象编程
4.4自编模块和调用
4.5包的调用
4.6sklearn简介
Logistic回归
5.1Logistic回归-1:二分类问题、logistics的回归、决策边界函数
5.2Logistic回归-2:logistic回归的损失函数、logistic回归的梯度下降、多分类问题
5.3过拟合与正则化
5.4线性回归与logistic回归的正则化
神经网络
6.1神经网络-1:神经网络的简介、logistic回归与神经元、神经网络的模型表示
6.2神经网络-2:向前传播算法、神经网络的非线性表示、多分类情形
6.3神经网络-3:激活函数、损失函数、梯度下降
6.4神经网络-4:计算图与反向传播、参数初始化、神经网络的设计
6.5卷积神经网络(第4次开课新增内容)
6.6循环神经网络(第4次开课新增内容)
模型的评价、诊断、改进及其设计
7.1模型评价与模型选择:模型评价、模型选择、模型改进的方向
7.2模型的诊断与改进:模型的诊断、正则化与偏差、方差问题、如何改进已有模型
7.3如何设计模型:介绍两个案例、误差分析、偏斜类数据、精确率、召回率、F1得分
决策树与集成学习
8.1决策树-1:什么是决策树、如何构建决策树、集合的纯度
8.2决策树-2:决策树经典算法ID3、C4.5、CART、属性值连续的情形、回归树
8.3集成树与集成学习:决策树的缺陷、有放回抽样、集成树与集成学习、随机森林、AdaBoost
8.4GBDT(第4次开课新增内容)
8.5XGBoost(第4次开课新增内容)
支持向量机
9.1支持向量机-1:算法的思想、支持向量与间隔、对偶问题、KKT条件、支持向量的求解
9.2支持向量机-2:软间隔、特征变换、核函数
9.3支持向量机-3:再生核希尔伯特空间、C和sigma平方的选择与多分类、支持向量回归与应用建议
聚类
10.1聚类-1:聚类任务、k-mean算法
10.2聚类-2:优化目标、如何选择聚类数、其他聚类算法(第2次开课修订)
降维
11.1降维-1:降维及其应用、主成分分析
11.2降维-2:压缩数据的重构、主成分分析的应用、其他降维方法
异常检测
12.1异常检测-1:什么是异常检测、异常检测系统构建与评估(第2次开课修订)
12.2异常检测-2:异常检测与有监督学习、如何选择使用的特征、基于多元分布的异常检测系统