-
第一章大数据概述
介绍从IT时代到大数据时代到来的重要因素和大数据的特征、定义、影响和大数据关键技术。
-
●1.1大数据时代
介绍信息技术革命为大数据时代提供技术支撑和三个方面表现以及数据产生方式的变革与大数据时代来临的重要因素。
-
●1.2大数据的概念和影响
介绍大数据特征、定义、构成、影响和大数据关键技术。
-
第二章大数据处理架构Hadoop
介绍Hadoop的由来、用途、特性、Hadoop的生态系统;hadoop集群搭建和测试方法。
-
●2.1Hadoop概述
介绍Hadoop基础知识,包括Hadoop的由来、用途、特性等。
-
●2.2Hadoop生态系统
介绍Hadoop从1.0到2.0版本演变过程中组成的变化和Hadoop生态系统组成。
-
●2.3Linux系统安装
介绍在Windows系统中安装虚拟软件工具和在虚拟环境中安装Linux虚拟机的方法和SSH客户端软件MobaXtem的下载安装方法。
-
●2.4Linux系统配置
介绍 Linux系统配置内容和方法。
-
●2.5Hadoop集群搭建
介绍Hadoop集群搭建内容和方法。
-
●2.6Hadoop集群测试
介绍执行Hadoop集群测试工作的方法和步骤。
-
第三章HDFS与MapReduce
介绍分布式文件系统HDFS、分布式数据库HBase和分布式编程框架MapReduce。
-
●3.1Hadoop分布式文件系统HDFS
介绍分布式文件系统、Hadoop分布式文件系统HDFS特性、HDFS主从式体系结构、HDFS的存储原理、HDFS提供的两种类型的访问接口:命令行接口Shell和程序访问接口java API。
-
●3.2分布式数据库HBase
介绍分布式数据库HBase的起源、与普通关系型数据库的对比、访问接口、数据模型、存储方式、安装与配置、常用的Shell API和Java API。
-
●3.3分布式计算框架MapReduce概述
介绍分布式计算框架Hadoop MapReduce设计思想、体系结构。
-
●3.4MapReduce编程
介绍MapReduce编程的设计思路并通过一个具体的实例wordCount项目说明MapReduce编程思路。
-
第四章数据可视化
介绍数据可视化的基础知识、可视化工具及可视化应用案例。
-
●4.1可视化概述
介绍数据可视化的定义、发展历程和重要作用。
-
●4.2可视化工具
举例说明可视化入门级工具、信息图表工具、地图工具、时间线工具和高级分析工具各自的用途和特点。
-
●4.3可视化实践案例一
介绍一个Echarts应用的简单实例,讲解Echarts的开发环境和配置语法。
-
●4.4可视化实践案例二
介绍一个Echarts的高级应用实例:香港18区人口密度 (2011)以及Echarts官网的应用案例。
-
第五章大数据的应用
介绍大数据的四个典型应用场景:智慧城市、大数据预测、精准营销、个性化推荐系统。
-
●5.1大数据在智慧城市中的应用
介绍智慧城市中大数据的应用。
-
●5.2基于大数据的预测
介绍大数据的核心价值:预测的应用,详细介绍大数据预测的四个特征。
-
●5.3基于大数据的精准营销
介绍一个基于大数据的精准营销的案例,用到客户行为大数据分析。
-
●5.4基于大数据的个性化推荐
介绍大数据在商业领域的个性化上平推荐系统应用,详细介绍大数据推荐系统的协同过滤算法。