大数据分析导论
1000+ 人选课
更新日期:2025/06/08
开课时间2025/01/21 - 2025/07/20
课程周期26 周
开课状态开课中
每周学时-
课程简介
《大数据分析导论》课程是数据科学领域为数不多的理论与实践相结合的通识型课程,它通过详细剖析大数据分析基础理论和实例实训,全景展现了大数据分析各个阶段的基础知识、相关方法、关键技术和实用工具。这无疑满足了国内在数据科学教育领域的迫切需要,也是国内开展应用型本科教学的有益尝试。 “产研共生”实现“数据价值共用”;“产教融合”实现“知识价值共享”;“学用结合”实现“师生价值共创”。“产研教学用”并举,培养学生数据意识、分析思维、创新能力和创业技能。 《大数据分析导论》课程的自编教材已受同行认可。课程配套的自编教材《大数据分析与挖掘》和自编的参考阅读用书《数据可视化导论》、《商务数据分析导论》都是课程负责人及其团队钻研学习的结果,都是江苏省十三五重点规划教材。
课程大纲

在线教程

章节简介教学计划
从头说起:什么是大数据分析
登录后可预览视频
为什么是大数据,为什么是现在?
朱晓峰
大数据,除了“大”,还有什么?
朱晓峰
什么是大数据分析?
朱晓峰
为什么学习大数据分析?
朱晓峰
如何实现大数据分析?
朱晓峰
大数据分析有哪些基本工具?
朱晓峰
大数据分析有哪些高级工具?
朱晓峰
如何避免大数据分析陷阱?
朱晓峰
始于足下:大数据采集
什么是大数据采集
朱晓峰
大数据采集有哪些好方法
朱晓峰
如何实现大数据采集
朱晓峰
谁的问题:大数据处理
为什么大数据需要处理
朱晓峰
如何清洗大数据
朱晓峰
如何高效清洗大数据
朱晓峰
突破想象:大数据挖掘分析
我们身边的大数据挖掘实例
朱晓峰
数据挖掘的“江湖地位”
朱晓峰
数据挖掘的规范流程
朱晓峰
数据挖掘的“四大金刚”
朱晓峰
讲述故事:大数据可视化
数据可视化不是浮云
朱晓峰
数据可视化的正确理解
朱晓峰
数据可视化的“三步大法”
朱晓峰
数据可视化的格式塔原则
朱晓峰
比较类数据如何“颜值在线”
朱晓峰
分布类数据如何“颜值在线”
朱晓峰
占比类数据如何“颜值在线”
朱晓峰
关联类数据如何“颜值在线”
朱晓峰
数据“颜值”的提升秘笈
朱晓峰
常见图形“颜值”的提升秘笈
朱晓峰
  • 第一章从头说起:什么是大数据分析

    从女排夺冠等众多案例,分析大数据分析的时代背景和重要作用;进而,通过大数据和大数据分析的概念界定、大数据分析的影响、基本流程、基本工具、高级工具和常见“陷阱”,帮助学生树立大数据分析的基本概念和整体认知。

  • 1.1为什么是大数据,为什么是现在?

    通过大数据与女排夺冠等案例,讲述大数据如何变革盈利途径,如何帮助我们认知世界。

  • 1.2大数据,除了“大”,还有什么?

    通过大数据的特征定义、思维变化,帮助理解什么是真正的大数据。

  • 1.3什么是大数据分析?

    通过梳理已有大数据分析已有概念,帮助梳理正确的大数据分析概念,进而对比传统数据分析的区别,并讲述了四个主要影响因素。

  • 1.4为什么学习大数据分析?

    通过实例说明大数据分析的四个作用和诸多影响。

  • 1.5如何实现大数据分析?

    大数据分析的关键步骤和注意要点。

  • 1.6大数据分析有哪些基本工具?

    讲述大数据分析最基本工具的功能和适用对象。

  • 1.7大数据分析有哪些高级工具?

    梳理、分类市面上几十种大数据分析工具,讲述它们的起源、特点和适用对象。

  • 1.8如何避免大数据分析陷阱?

    通过四个“陷阱”,讲述如何避免大数据分析的常见错误。

  • 第二章始于足下:大数据采集

    大数据采集是大数据分析的基础,只有完备的数据采集才能增强大数据分析的正确性和有效性。本章节主要明确大数据采集的含义、基本原则、具体方法、常见工具等。

  • 2.1什么是大数据采集

    通过RFID、六度原则等介绍大数据采集的含义、原则与对象。

  • 2.2大数据采集有哪些好方法

    通过两个维度讲述大数据采集的8种方法。

  • 2.3如何实现大数据采集

    在介绍三种采集来源的基础上,重点讲述了9种国内外数据采集工具的渊源、特点和适用对象。

  • 第三章谁的问题:大数据处理

    大数据分析的根基是数据,但数据质量是数据的生命。本章节通过大数据质量的含义、清洗数据的关键环节以及最新工具,确保数据从不可用到可用,从低可用到高可用。

  • 3.1为什么大数据需要处理

    解释大数据质量的意义和根源,并通过十个实例介绍了常见的“脏”数据。

  • 3.2如何清洗大数据

    在介绍大数据清洗概念的基础上,重点讲解了清洗的六个关键环节及其注意要点。

  • 3.3如何高效清洗大数据

    介绍了清洗大数据的新方式——可视化清洗的含义、过程和方法,并解释说明了4个免费清洗工具和3类商业化清洗工具。

  • 第四章突破想象:大数据挖掘分析

    大数据挖掘分析,可以帮助我们获得事先不知道的信息和知识。因此,本章节通过阿里的大数据挖掘应用案例和“西游记”讲述大数据挖掘的实际应用价值和难易程度,通过规范流程和四个基本任务,树立大数据挖掘的核心认知。

  • 4.1我们身边的大数据挖掘实例

    通过阿里鹿班(鲁班)系统、阿里AI文案,介绍了大数据挖掘的实际应用价值。

  • 4.2数据挖掘的“江湖地位”

    主要借助“西游记”,说明了数据挖掘的难易程度和核心认知。

  • 4.3数据挖掘的规范流程

    通过CRISP-DM模型和SEMMA,说明了数据挖掘的主要阶段和重点内容。

  • 4.4数据挖掘的“四大金刚”

    围绕数据挖掘的四个基本任务:分类、聚类、关联分析、估测和预测,讲解了各自的含义、实现与应用。

  • 第五章讲述故事:大数据可视化

    “字不如表,表不如图”。本章节通过“煎鸡蛋模型”讲述数据可视化的重要作用,通过数据可视化的定义、流程、格式塔原则构建数据可视化的基础理论,通过比较类、分部类、占比类、关联类数据相关图形和实例展现如何实现数据可视化,通过相关规范揭示如何优化已有的数据可视化作品

  • 5.1数据可视化不是浮云

    借助“煎鸡蛋模型”,总结数据可视化的作用。

  • 5.2数据可视化的正确理解

    通过梳理已有数据可视化的已有定义,帮助界定正确的数据可视化基本概念,进而分析数据可视化的本质,并讲述了2个数据可视化的常见类型。

  • 5.3数据可视化的“三步大法”

    通过“指标图形化”、“指标值图形化”和“指标关系图形化”,帮助实现数据可视化。

  • 5.4数据可视化的格式塔原则

    通过含义、示例和实例,分别讲授了数据可视化的格式塔原则:格式塔原则,包括:简单原则、相似原则、接近原则、闭合原则、连续原则、主体/背景原则、对称原则、共同命运原则。

  • 5.5比较类数据如何“颜值在线”

    主要讲授了柱状图、条形图、气泡图和子弹图四种图形的含义、示例和实例。

  • 5.6分布类数据如何“颜值在线”

    主要讲授了地图、热力图、直方图和箱线图四种图形的含义、示例和实例。

  • 5.7占比类数据如何“颜值在线”

    主要讲授了饼图、南丁格尔玫瑰图、词云图和桑基图四种图形的含义、示例和实例。

  • 5.8关联类数据如何“颜值在线”

    主要讲授了散点图、马赛克图、维恩图、弦图和矩形树图四种图形的含义、示例和实例。

  • 5.9数据“颜值”的提升秘笈

    借助数据墨水比原则和可视化的八条规范,优化已有的数据可视化作品。

  • 5.10常见图形“颜值”的提升秘笈

    要讲解柱状图、折线图、饼图、气泡图和面积图的改进优化套路。

  • 开始学习
  • 第一章  作业测试
    第一章 从头说起:什么是大数据分析

    1.1 为什么是大数据,为什么是现在?

    1.2 大数据,除了“大”,还有什么?

    1.3 什么是大数据分析?

    1.4 为什么学习大数据分析?

    1.5 如何实现大数据分析?

    1.6 大数据分析有哪些基本工具?

    1.7 大数据分析有哪些高级工具?

    1.8 如何避免大数据分析陷阱?

    视频数8
  • 第二章  作业测试
    第二章 始于足下:大数据采集

    2.1 什么是大数据采集

    2.2 大数据采集有哪些好方法

    2.3 如何实现大数据采集

    视频数3
  • 第三章  作业测试
    第三章 谁的问题:大数据处理

    3.1 为什么大数据需要处理

    3.2 如何清洗大数据

    3.3 如何高效清洗大数据

    视频数3
  • 第四章  作业测试
    第四章 突破想象:大数据挖掘分析

    4.1 我们身边的大数据挖掘实例

    4.2 数据挖掘的“江湖地位”

    4.3 数据挖掘的规范流程

    4.4 数据挖掘的“四大金刚”

    视频数4
  • 第五章  作业测试
    第五章 讲述故事:大数据可视化

    5.1 数据可视化不是浮云

    5.2 数据可视化的正确理解

    5.3 数据可视化的“三步大法”

    5.4 数据可视化的格式塔原则

    5.5 比较类数据如何“颜值在线”

    5.6 分布类数据如何“颜值在线”

    5.7 占比类数据如何“颜值在线”

    5.8 关联类数据如何“颜值在线”

    5.9 数据“颜值”的提升秘笈

    5.10 常见图形“颜值”的提升秘笈

    视频数10
  • 期末考试