python数据分析与应用
python数据分析与应用
5000+ 人选课
更新日期:2025/05/13
开课平台智慧树
开课高校西安财经大学
开课教师陈树广姚树俊陈玲丽江秀萍黄艳王昀
学科专业工学计算机类
开课时间2025/01/21 - 2025/07/20
课程周期26 周
开课状态开课中
每周学时-
课程简介
本课程站在初学者的角度,按照培养数据科学家一样的思维方式的思路,介绍Python语言编程及数据分析重要模块。围绕介绍数据分析人员所需具备的编程思想、编程能力,从初学者的无语言基础角度出发,用生动的示例和丰富的练习来引导读者渐入佳境。
课程大纲

在线教程

章节简介教学计划
环境配置与课程概述
登录后可预览视频
Python环境的安装与配置与注意事项
陈树广
数据分析基础与Python简介
数据分析基础
姚树俊
数据分析常用的统计方法介绍
姚树俊
数据分析的作用与常用工具
姚树俊
Python编程基础
Python基本语法
江秀萍
Python运算符
江秀萍
Python数据类型
数字
江秀萍
字符串
江秀萍
列表
江秀萍
元组
江秀萍
集合
江秀萍
字典
江秀萍
Python数据类型转换
江秀萍
Python流程控制语句
分支语句
王昀
循环语句
王昀
break和continue语句及else子句
王昀
Python函数
认识Python函数
王昀
函数其他知识
王昀
String字符串
创建字符串
陈树广
Python字符串拼接
陈树广
Python字符串和数字的拼接
陈树广
Python文件操作
文件的基本操作
陈树广
OS模块
陈树广
Python面向对象基础
Python面向对象概述、类与方法
陈树广
Python异常处理
陈树广
Python模块
陈树广
Python NumPy 库
Python NumPy库简介
黄艳
NumPy数组的创建与使用
黄艳
NumPy的数据类型
黄艳
NumPy 数组索引和切片
黄艳
NumPy数组的运算
黄艳
NumPy矩阵的创建和使用
黄艳
使用NumPy读写文件
黄艳
Python Pandas教程
Pandas Series对象创建及常用操作
陈玲丽
Pandas DataFrame对象创建及常用操作
陈玲丽
Pandas Index索引对象
陈玲丽
Pandas数据运算、筛选与数据统计函数
陈玲丽
Pandas文件读写简介
陈玲丽
Pandas基本统计分析与数据处理
陈玲丽
Pandas内置的字符串处理方法
陈玲丽
Python Matplotlib教程
Python Matplotlib库概述
陈树广
Pyplot绘图教程
陈树广
常见统计图形绘制
陈树广
Python的AI的应用
Python AI(人工智能)简介
陈树广
Python Jieba库及实例
陈树广
Python Wordcloud入门
陈树广
Stylecloud简洁易用的词云库
陈树广
  • 绪章环境配置与课程概述

    创建新的Python环境—Anaconda,启用Jupyter Notebook,常见的数据分析工具,本课程的学习建议。

  • 0.1Python环境的安装与配置与注意事项

    Python环境的安装与配置与注意事项

  • 第一章数据分析基础与Python简介

    重点介绍了数据分析的过程,包括问题定义、数据采集、数据预处理、数据探索和数据可视化、预测模型的创建和选择、模型评估和部署等,以及数据分析的作用和数据分析的常用工具,对python的发展及特点、安装与配置进行讲解。

  • 1.1数据分析基础

    在大数据环境的作用下,从数据里面发现并挖掘有价值的信息变得愈发重要,数据分析应运而生。

  • 1.2数据分析常用的统计方法介绍

    在大数据环境下,针对不同业务问题可以制作各种具体的数据模型去分析问题,运用各种分析方法去探索数据。

  • 1.3数据分析的作用与常用工具

    数据分析的目的是把隐藏在一些看似杂乱无章的数据背后的信息提炼出来,总结出所研究对象的内在规律。在实际工作中,数据分析能够帮助管理者进行判断和决策,以便采取适当策略与行动。

  • 第二章Python编程基础

    编程基础是进行程序设计与数据分析的第一步,包括基本的输入输出语句、注释语句、标识符的规范以及变量的定义赋值、及各类运算符的用法。

  • 2.1Python基本语法

    基本语法是编程语言程序设计的规则,了解基本语法是开始程序设计的基础。包含基本的输入输出语句、注释语句、标识符的规范以及变量的定义赋值及使用。

  • 2.2Python运算符

    本节主要内容包含算术运算符、赋值运算符、复合赋值运算符、关系运算符、逻辑运算符、成员运算符等运算符的用法及举例。

  • 第三章Python数据类型

    主要讲述了数据的类型中最常见的数字类型的分类及使用,各种常见的数据结构类型:字符串、列表、元组、集合、字典等定义及可以引用的方法。

  • 3.1数字

    主要讲述了数据的类型中最常见的数字类型的分类及使用。

  • 3.2字符串

    本节内容对字符串型数据的格式化输出及字符串截取的方法。

  • 3.3列表

    本节内容对字列表型数据的定义、创建及访问作了简单的介绍。

  • 3.4元组

    本节内容对元组型数据的定义、创建及元组元素的访问作了一个简单的介绍。

  • 3.5集合

    本节内容对集合型数据的定义、创建及常用的方法作了一个简单的介绍。

  • 3.6字典

    本节内容对字典型数据的定义、创建、字典元素的添加修改删除作了一个简单的介绍。

  • 3.7Python数据类型转换

    这一节主要讲了多种数据类型之间相互转换的一些规则。

  • 第四章Python流程控制语句

    流程控制是指在程序执行时,通过一些特定的指令,更改程序语句的执行顺序,使程序执行时产生跳跃或者回溯等现象。Python中的流程控制语句有分支语句,循环语句和跳转语句。

  • 4.1分支语句

    if语句可以使程序产生分支,根据分支数量的不同,if语句可分为单分支、双分支和多分支语句。

  • 4.2循环语句

    在程序中如果想重复执行某些操作,可以使用循环语句实现。Python提供了两种循环语句,分别是while循环和for循环。

  • 4.3break和continue语句及else子句

    Python支持使用break语句跳出整个循环,使用continue语句跳出本次循环。除了判断语句,Python中的while和for循环中也可以使用else语句。在循环中使用时,else语句只在循环完成后执行。

  • 第五章Python函数

    函数作为关联功能的代码段,可以提高代码的复用性、降低代码冗余、使程序结构更加清晰,可以很好的提高应用的模块化。

  • 5.1认识Python函数

    函数指被封装起来的、实现某种功能的一段代码,它可以被其他函数调用。函数是一种特定的代码组织结构。

  • 5.2函数其他知识

    变量的作用域是指变量的作用范围,局部变量的作用域是函数内部,全局变量拥有全局作用域,匿名函数是无需函数名标识的函数。

  • 第六章String字符串

    字符串的定义与相关操作。

  • 6.1创建字符串

    字符编码,常见格式,字符串的定义,边接与复制

  • 6.2Python字符串拼接

    Python字符串拼接方法,成员检查运算。

  • 6.3Python字符串和数字的拼接

    借助str()和repr()函数将数字转换为字符串。

  • 第七章Python文件操作

    在Python里,文件也是一种类型的对象,包括文本文件、图片文件、音频文件、视频文件等,Python 提供了必要的函数和方法进行默认情况下的文件基本操作,可以用 file 对象做大部分的文件操作。

  • 7.1文件的基本操作

    文件的属性和函数查看方法,open()打开或者创建一个文件,close()关闭文件,read()读取文件,redline()读取一行文件,readlines(),write()写入文件,writelines()将序列写入文件中,文件定位。

  • 7.2OS模块

    使用os.path模块操作文件路径,读入所有文件的所有行,使用fileinput模块;使用tempfile模块创建临时文件和文件夹;更高级的文件和文件夹处理,请使用shutil模块。如果想要了解os模块的所有内容,可以使用dir(os)方法查看。

  • 第八章Python面向对象基础

    本章主要介绍面向对象的基本概念、异常处理、及模块等相关知识,主要内容包括:Python面向对象编程、 Python中的异常处理、 魔术方法、属性和迭代器、构造函数、。

  • 8.1Python面向对象概述、类与方法

    Python从设计之初就已经是一门面向对象的语言,在Python中创建一个类和对象是很容易的。类是OOP中的重要概念,也是学习Python的一个跨跃,面向对象部分主要概念,类和对象的定义,类属性与方法,继承与重载,方法重写,运算符重载。

  • 8.2Python异常处理

    编写程序时,我们通常要辨别事件的异常情况,这些异常通常是程序本身的设计错误,也可能是外界环境发生了变化。有时在Python程序的语法是正确情况下,运行时也有可能发生错误。运行期检测到的错误被称为异常,大多数的异常都不会被程序处理,都以错误信息的形式展现在这里。

  • 8.3Python模块

    模块是一系列常用功能的集合体,Python模块的导入,第三方模块的安装,自定义Python模块。

  • 第九章Python NumPy 库

    NumPy是Numerical Python的缩写,它是一个开源的Python科学计算库。Python NumPy的强大源于它对数组(矩阵)的支持,NumPy数组不仅可以是任意维度的,而且能容纳大量的数据。NumPy内置了对数组的各种数学运算,包括排序、变形、展平、转置、轴对换、拼接、分割、去重、检索、傅里叶变换、随机数生成等。NumPy在底层使用了C/C++代码,所以它是非常快速的。

  • 9.1Python NumPy库简介

    Numpy库是用于科学计算的一个开源Python的扩充程序库,为Python提供了高性能数组与矩阵运算处理能力。是其他程序分析包的一个基础,很多库是依赖这个 Numpy库来建立的。Numpy的强大主要源自于他对数组和矩阵的支持,所以Numpy数组不仅可以是任意维度的,而且还能够容纳大量的数据。并且Numpy可以对数组进行各种数学运算。

  • 9.2NumPy数组的创建与使用

    NumPy提供了两种基本对象:ndarray(N-dimensional Array Object)和ufunc(Universal Function)。其中,ndarray是一个多维数组对象,该对象由两个部分组成,即实际的数据和描述这些数据的元数据。大部分的数组操作仅仅修改元数据部分,而不改变底层的实际数据。而ufunc则是能够对数组进行处理的函数。

  • 9.3NumPy的数据类型

    Python支持的数据类型有整型、浮点型和复数型,但这些类型不足以满足科学计算的需求,因此NumPy添加了很多其他的数据类型。在实际应用中,为了提高计算结果的准确度,需要使用不同精度的数据类型,并且不同的数据类型所占用的内存空间也是不同的。在NumPy中,大部分数据类型名是以数字结尾的,这个数字表示其在内存中占用的位数。

  • 9.4NumPy 数组索引和切片

    在之前介绍了选取数组中的某个特定元素的方法,即在数组名后面加方括号。方括号里面是数组的下标。数组下标就是数组的索引。数组与列表的索引类似,也分为正索引和负索引两种,数组的正索引是从0开始,自左向右以1为步长逐渐递增;而数组的负索引呢就是从右到左标,最右边的数组元素为-1,然后向左依次类推为-2,-3等。数组的切片也是通过索引对数组中的元素进行提取的。其中索引访问提取仅返回数组的一个对应元素,而切片则会返回数组中的一个区域内所对应的元素。

  • 9.5NumPy数组的运算

    Numpy中数组的运算支持向量化的运算,将本来需要在Python级别进行的循环,放到C语言的运算中,明显地来提高了程序的运算速度。

  • 9.6NumPy矩阵的创建和使用

    在NumPy中还包含两种基本的数据类型,即数组和矩阵。NumPy中的矩阵对象为matrix,它包含有矩阵的数据处理、矩阵计算、转置、可逆性等功能。matrix是ndarray的子类,因此,矩阵会含有数组的所有数据属性和方法。

  • 9.7使用NumPy读写文件

    通常情况下,数据是以文件形式存储的。常用的存储文件的格式有文本文件、CSV格式文件、二进制格式文件和多维数据文件等。在数据分析中,经常需要从文件中读取数据或将数据写入文件,因此,学会读写文件操作是深入学习NumPy的基础。

  • 第十章Python Pandas教程

    [简介] Pandas库是用于数据分析的著名开源Python库, 是目前所有使用Python语言研究和分析数据集的专业人士在做相关统计分析和决策时都需要使用的不可或缺的工具。Pandas的核心是Series和DataFrame两大数据结构,数据分析相关的所有事务都是围绕着这两种结构进行的。本章Python Pandas的教程,将教会你如何快速便捷的处理数据。

  • 10.1Pandas Series对象创建及常用操作

    Pandas Series对象创建及常用操作

  • 10.2Pandas DataFrame对象创建及常用操作

    Pandas DataFrame对象创建及常用操作

  • 10.3Pandas Index索引对象

    Pandas Index索引对象

  • 10.4Pandas数据运算、筛选与数据统计函数

    Pandas数据运算、筛选与数据统计函数

  • 10.5Pandas文件读写简介

    Pandas文件读写简介

  • 10.6Pandas基本统计分析与数据处理

    Pandas基本统计分析与数据处理

  • 10.7Pandas内置的字符串处理方法

    Pandas内置的字符串处理方法

  • 第十一章Python Matplotlib教程

    本章主要讲解了数据可视化的相关内容,具体包括数据可视化的概念、常用的图表类型,以及常用的数据可视化工具:Matplotlib、seaborn、bokeh,最后开发了一个画图分析旅游景点的案例。

  • 11.1Python Matplotlib库概述

    什么是数据可视化,常见的图表类型。

  • 11.2Pyplot绘图教程

    通过figure()函数创建画布,通过subplot()函数创建单个子图,通过subplots()函数创建多个子图,通过add_subplot()方法添加和选中子图。

  • 11.3常见统计图形绘制

    matplotlib.pyplot模块中包含了快速生成多种图表的函数,Bokeh是针对浏览器使用的交互式可视化库,它旨在提供优雅、简洁的通用图形,帮助程序员快速地、轻松地创建交互图、数据应用程序等。

  • 第十二章Python的AI的应用

    人工智能(Artificial Intelligence,AI)是让机器能够像人类一样完成智能化任务的技术。今天,在我们的生活中,人工智能已经有了形式多样、领域广泛、程度不同的应用。

  • 12.1Python AI(人工智能)简介

    在人工智能领域,Python编程语言具有一些先天的优势,Python的第三方库针对各种各样的专业应用领域,例如,用于图像处理的各种Python Imaging Library库、VTK和Maya3D等,支持机器学习的scikit-learn、Py Brain、PyML等,用于自然语言处理的NLTK、jieba等等。因此只要学习和掌握了Python语言,要开发人工智能的相关应用方面,就拥有了得天独厚的优势。

  • 12.2Python Jieba库及实例

    文本预处理一般包括分词、词形归一化、删除停用词。

  • 12.3Python Wordcloud入门

    我们要是对文本数据中出现频率较高的“关键词”在视觉上的突出呈现,把关键词的渲染成类似云一样的彩色图片,从而一眼就可以领略文本数据所要表达的主要意思,本节借助的是wordcloud这个词云模块。

  • 12.4Stylecloud简洁易用的词云库

    stylecloud 是一位数据科学家叫Max Woolf的大神做出来的wordcloud词云包的升级版,专门来解救一帮美术水平不高,但又对词云效果有些追求的读者,本节介绍这一个模块的使用。

  • 开始学习
  • 绪章  作业测试
    绪章环境配置与课程概述

    0.1 Python环境的安装与配置与注意事项

    视频数1
  • 第一章  作业测试
    第一章 数据分析基础与Python简介

    1.1 数据分析基础

    1.2 数据分析常用的统计方法介绍

    1.3 数据分析的作用与常用工具

    视频数3
  • 第二章  作业测试
    第二章 Python编程基础

    2.1 Python基本语法

    2.2 Python运算符

    视频数2
  • 第三章  作业测试
    第三章 Python数据类型

    3.1 数字

    3.2 字符串

    3.3 列表

    3.4 元组

    3.5 集合

    3.6 字典

    3.7 Python数据类型转换

    视频数7
  • 第四章  作业测试
    第四章 Python流程控制语句

    4.1 分支语句

    4.2 循环语句

    4.3 break和continue语句及else子句

    视频数3
  • 第五章  作业测试
    第五章 Python函数

    5.1 认识Python函数

    5.2 函数其他知识

    视频数2
  • 第六章  作业测试
    第六章 String字符串

    6.1 创建字符串

    6.2 Python字符串拼接

    6.3 Python字符串和数字的拼接

    视频数3
  • 第七章  作业测试
    第七章 Python文件操作

    7.1 文件的基本操作

    7.2 OS模块

    视频数2
  • 第八章  作业测试
    第八章 Python面向对象基础

    8.1 Python面向对象概述、类与方法

    8.2 Python异常处理

    8.3 Python模块

    视频数3
  • 第九章  作业测试
    第九章 Python NumPy 库

    9.1 Python NumPy库简介

    9.2 NumPy数组的创建与使用

    9.3 NumPy的数据类型

    9.4 NumPy 数组索引和切片

    9.5 NumPy数组的运算

    9.6 NumPy矩阵的创建和使用

    9.7 使用NumPy读写文件

    视频数7
  • 第十章  作业测试
    第十章 Python Pandas教程

    10.1 Pandas Series对象创建及常用操作

    10.2 Pandas DataFrame对象创建及常用操作

    10.3 Pandas Index索引对象

    10.4 Pandas数据运算、筛选与数据统计函数

    10.5 Pandas文件读写简介

    10.6 Pandas基本统计分析与数据处理

    10.7 Pandas内置的字符串处理方法

    视频数7
  • 第十一章  作业测试
    第十一章 Python Matplotlib教程

    11.1 Python Matplotlib库概述

    11.2 Pyplot绘图教程

    11.3 常见统计图形绘制

    视频数3
  • 第十二章  作业测试
    第十二章 Python的AI的应用

    12.1 Python AI(人工智能)简介

    12.2 Python Jieba库及实例

    12.3 Python Wordcloud入门

    12.4 Stylecloud简洁易用的词云库

    视频数4
  • 期末考试