本书介绍了大数据发展历程、基本概念、主要影响、应用领域、关键技术、计算模式和产业发展,云计算、物联网的概念及其与大数据之间的紧密关系;介绍了Hadoop的发展历史、重要特性和应用现状,Hadoop项目结构及其各个组件,并熟练掌握Hadoop平台的安装和使用方法;介绍了分布式文件系统的基本概念、结构和设计需求,掌握Hadoop分布式文件系统HDFS的重要概念、体系结构、存储原理和读写过程,并熟练掌握分布式文件系统HDFS的使用方法;介绍了MapReduce模型,掌握具体工作流程,以及MapReduce的具体应用;介绍了大数据处理架构Spark的基本原理和编程方法;介绍了数据可视化的基本概念,分类学习数据可视化工具。本书为大数据课程的教学提供了一定的理论支持,学生通过教材中的内容可以对学习的大致方向有一个基本的了解,本书的实践性教学环节有助于学生巩固所学知识,提高综合实践能力和独立分析解决问题的能力。本书适合作为应用型本科院校大数据课程的教材。