-
绪章环境配置与课程概述
创建新的Python环境—Anaconda,启用Jupyter Notebook,常见的数据分析工具,本课程的学习建议。
-
●0.1Python环境的安装与配置与注意事项
Python环境的安装与配置与注意事项
-
第一章数据分析基础与Python简介
重点介绍了数据分析的过程,包括问题定义、数据采集、数据预处理、数据探索和数据可视化、预测模型的创建和选择、模型评估和部署等,以及数据分析的作用和数据分析的常用工具,对python的发展及特点、安装与配置进行讲解。
-
●1.1数据分析基础
在大数据环境的作用下,从数据里面发现并挖掘有价值的信息变得愈发重要,数据分析应运而生。
-
●1.2数据分析常用的统计方法介绍
在大数据环境下,针对不同业务问题可以制作各种具体的数据模型去分析问题,运用各种分析方法去探索数据。
-
●1.3数据分析的作用与常用工具
数据分析的目的是把隐藏在一些看似杂乱无章的数据背后的信息提炼出来,总结出所研究对象的内在规律。在实际工作中,数据分析能够帮助管理者进行判断和决策,以便采取适当策略与行动。
-
第二章Python编程基础
编程基础是进行程序设计与数据分析的第一步,包括基本的输入输出语句、注释语句、标识符的规范以及变量的定义赋值、及各类运算符的用法。
-
●2.1Python基本语法
基本语法是编程语言程序设计的规则,了解基本语法是开始程序设计的基础。包含基本的输入输出语句、注释语句、标识符的规范以及变量的定义赋值及使用。
-
●2.2Python运算符
本节主要内容包含算术运算符、赋值运算符、复合赋值运算符、关系运算符、逻辑运算符、成员运算符等运算符的用法及举例。
-
第三章Python数据类型
主要讲述了数据的类型中最常见的数字类型的分类及使用,各种常见的数据结构类型:字符串、列表、元组、集合、字典等定义及可以引用的方法。
-
●3.1数字
主要讲述了数据的类型中最常见的数字类型的分类及使用。
-
●3.2字符串
本节内容对字符串型数据的格式化输出及字符串截取的方法。
-
●3.3列表
本节内容对字列表型数据的定义、创建及访问作了简单的介绍。
-
●3.4元组
本节内容对元组型数据的定义、创建及元组元素的访问作了一个简单的介绍。
-
●3.5集合
本节内容对集合型数据的定义、创建及常用的方法作了一个简单的介绍。
-
●3.6字典
本节内容对字典型数据的定义、创建、字典元素的添加修改删除作了一个简单的介绍。
-
●3.7Python数据类型转换
这一节主要讲了多种数据类型之间相互转换的一些规则。
-
第四章Python流程控制语句
流程控制是指在程序执行时,通过一些特定的指令,更改程序语句的执行顺序,使程序执行时产生跳跃或者回溯等现象。Python中的流程控制语句有分支语句,循环语句和跳转语句。
-
●4.1分支语句
if语句可以使程序产生分支,根据分支数量的不同,if语句可分为单分支、双分支和多分支语句。
-
●4.2循环语句
在程序中如果想重复执行某些操作,可以使用循环语句实现。Python提供了两种循环语句,分别是while循环和for循环。
-
●4.3break和continue语句及else子句
Python支持使用break语句跳出整个循环,使用continue语句跳出本次循环。除了判断语句,Python中的while和for循环中也可以使用else语句。在循环中使用时,else语句只在循环完成后执行。
-
第五章Python函数
函数作为关联功能的代码段,可以提高代码的复用性、降低代码冗余、使程序结构更加清晰,可以很好的提高应用的模块化。
-
●5.1认识Python函数
函数指被封装起来的、实现某种功能的一段代码,它可以被其他函数调用。函数是一种特定的代码组织结构。
-
●5.2函数其他知识
变量的作用域是指变量的作用范围,局部变量的作用域是函数内部,全局变量拥有全局作用域,匿名函数是无需函数名标识的函数。
-
第六章String字符串
字符串的定义与相关操作。
-
●6.1创建字符串
字符编码,常见格式,字符串的定义,边接与复制
-
●6.2Python字符串拼接
Python字符串拼接方法,成员检查运算。
-
●6.3Python字符串和数字的拼接
借助str()和repr()函数将数字转换为字符串。
-
第七章Python文件操作
在Python里,文件也是一种类型的对象,包括文本文件、图片文件、音频文件、视频文件等,Python 提供了必要的函数和方法进行默认情况下的文件基本操作,可以用 file 对象做大部分的文件操作。
-
●7.1文件的基本操作
文件的属性和函数查看方法,open()打开或者创建一个文件,close()关闭文件,read()读取文件,redline()读取一行文件,readlines(),write()写入文件,writelines()将序列写入文件中,文件定位。
-
●7.2OS模块
使用os.path模块操作文件路径,读入所有文件的所有行,使用fileinput模块;使用tempfile模块创建临时文件和文件夹;更高级的文件和文件夹处理,请使用shutil模块。如果想要了解os模块的所有内容,可以使用dir(os)方法查看。
-
第八章Python面向对象基础
本章主要介绍面向对象的基本概念、异常处理、及模块等相关知识,主要内容包括:Python面向对象编程、 Python中的异常处理、 魔术方法、属性和迭代器、构造函数、。
-
●8.1Python面向对象概述、类与方法
Python从设计之初就已经是一门面向对象的语言,在Python中创建一个类和对象是很容易的。类是OOP中的重要概念,也是学习Python的一个跨跃,面向对象部分主要概念,类和对象的定义,类属性与方法,继承与重载,方法重写,运算符重载。
-
●8.2Python异常处理
编写程序时,我们通常要辨别事件的异常情况,这些异常通常是程序本身的设计错误,也可能是外界环境发生了变化。有时在Python程序的语法是正确情况下,运行时也有可能发生错误。运行期检测到的错误被称为异常,大多数的异常都不会被程序处理,都以错误信息的形式展现在这里。
-
●8.3Python模块
模块是一系列常用功能的集合体,Python模块的导入,第三方模块的安装,自定义Python模块。
-
第九章Python NumPy 库
NumPy是Numerical Python的缩写,它是一个开源的Python科学计算库。Python NumPy的强大源于它对数组(矩阵)的支持,NumPy数组不仅可以是任意维度的,而且能容纳大量的数据。NumPy内置了对数组的各种数学运算,包括排序、变形、展平、转置、轴对换、拼接、分割、去重、检索、傅里叶变换、随机数生成等。NumPy在底层使用了C/C++代码,所以它是非常快速的。
-
●9.1Python NumPy库简介
Numpy库是用于科学计算的一个开源Python的扩充程序库,为Python提供了高性能数组与矩阵运算处理能力。是其他程序分析包的一个基础,很多库是依赖这个 Numpy库来建立的。Numpy的强大主要源自于他对数组和矩阵的支持,所以Numpy数组不仅可以是任意维度的,而且还能够容纳大量的数据。并且Numpy可以对数组进行各种数学运算。
-
●9.2NumPy数组的创建与使用
NumPy提供了两种基本对象:ndarray(N-dimensional Array Object)和ufunc(Universal Function)。其中,ndarray是一个多维数组对象,该对象由两个部分组成,即实际的数据和描述这些数据的元数据。大部分的数组操作仅仅修改元数据部分,而不改变底层的实际数据。而ufunc则是能够对数组进行处理的函数。
-
●9.3NumPy的数据类型
Python支持的数据类型有整型、浮点型和复数型,但这些类型不足以满足科学计算的需求,因此NumPy添加了很多其他的数据类型。在实际应用中,为了提高计算结果的准确度,需要使用不同精度的数据类型,并且不同的数据类型所占用的内存空间也是不同的。在NumPy中,大部分数据类型名是以数字结尾的,这个数字表示其在内存中占用的位数。
-
●9.4NumPy 数组索引和切片
在之前介绍了选取数组中的某个特定元素的方法,即在数组名后面加方括号。方括号里面是数组的下标。数组下标就是数组的索引。数组与列表的索引类似,也分为正索引和负索引两种,数组的正索引是从0开始,自左向右以1为步长逐渐递增;而数组的负索引呢就是从右到左标,最右边的数组元素为-1,然后向左依次类推为-2,-3等。数组的切片也是通过索引对数组中的元素进行提取的。其中索引访问提取仅返回数组的一个对应元素,而切片则会返回数组中的一个区域内所对应的元素。
-
●9.5NumPy数组的运算
Numpy中数组的运算支持向量化的运算,将本来需要在Python级别进行的循环,放到C语言的运算中,明显地来提高了程序的运算速度。
-
●9.6NumPy矩阵的创建和使用
在NumPy中还包含两种基本的数据类型,即数组和矩阵。NumPy中的矩阵对象为matrix,它包含有矩阵的数据处理、矩阵计算、转置、可逆性等功能。matrix是ndarray的子类,因此,矩阵会含有数组的所有数据属性和方法。
-
●9.7使用NumPy读写文件
通常情况下,数据是以文件形式存储的。常用的存储文件的格式有文本文件、CSV格式文件、二进制格式文件和多维数据文件等。在数据分析中,经常需要从文件中读取数据或将数据写入文件,因此,学会读写文件操作是深入学习NumPy的基础。
-
第十章Python Pandas教程
[简介] Pandas库是用于数据分析的著名开源Python库, 是目前所有使用Python语言研究和分析数据集的专业人士在做相关统计分析和决策时都需要使用的不可或缺的工具。Pandas的核心是Series和DataFrame两大数据结构,数据分析相关的所有事务都是围绕着这两种结构进行的。本章Python Pandas的教程,将教会你如何快速便捷的处理数据。
-
●10.1Pandas Series对象创建及常用操作
Pandas Series对象创建及常用操作
-
●10.2Pandas DataFrame对象创建及常用操作
Pandas DataFrame对象创建及常用操作
-
●10.3Pandas Index索引对象
Pandas Index索引对象
-
●10.4Pandas数据运算、筛选与数据统计函数
Pandas数据运算、筛选与数据统计函数
-
●10.5Pandas文件读写简介
Pandas文件读写简介
-
●10.6Pandas基本统计分析与数据处理
Pandas基本统计分析与数据处理
-
●10.7Pandas内置的字符串处理方法
Pandas内置的字符串处理方法
-
第十一章Python Matplotlib教程
本章主要讲解了数据可视化的相关内容,具体包括数据可视化的概念、常用的图表类型,以及常用的数据可视化工具:Matplotlib、seaborn、bokeh,最后开发了一个画图分析旅游景点的案例。
-
●11.1Python Matplotlib库概述
什么是数据可视化,常见的图表类型。
-
●11.2Pyplot绘图教程
通过figure()函数创建画布,通过subplot()函数创建单个子图,通过subplots()函数创建多个子图,通过add_subplot()方法添加和选中子图。
-
●11.3常见统计图形绘制
matplotlib.pyplot模块中包含了快速生成多种图表的函数,Bokeh是针对浏览器使用的交互式可视化库,它旨在提供优雅、简洁的通用图形,帮助程序员快速地、轻松地创建交互图、数据应用程序等。
-
第十二章Python的AI的应用
人工智能(Artificial Intelligence,AI)是让机器能够像人类一样完成智能化任务的技术。今天,在我们的生活中,人工智能已经有了形式多样、领域广泛、程度不同的应用。
-
●12.1Python AI(人工智能)简介
在人工智能领域,Python编程语言具有一些先天的优势,Python的第三方库针对各种各样的专业应用领域,例如,用于图像处理的各种Python Imaging Library库、VTK和Maya3D等,支持机器学习的scikit-learn、Py Brain、PyML等,用于自然语言处理的NLTK、jieba等等。因此只要学习和掌握了Python语言,要开发人工智能的相关应用方面,就拥有了得天独厚的优势。
-
●12.2Python Jieba库及实例
文本预处理一般包括分词、词形归一化、删除停用词。
-
●12.3Python Wordcloud入门
我们要是对文本数据中出现频率较高的“关键词”在视觉上的突出呈现,把关键词的渲染成类似云一样的彩色图片,从而一眼就可以领略文本数据所要表达的主要意思,本节借助的是wordcloud这个词云模块。
-
●12.4Stylecloud简洁易用的词云库
stylecloud 是一位数据科学家叫Max Woolf的大神做出来的wordcloud词云包的升级版,专门来解救一帮美术水平不高,但又对词云效果有些追求的读者,本节介绍这一个模块的使用。