
会员
Spark SQL入门与实践指南
纪涵更新时间:2019-12-06 16:38:46
最新章节:9.9 本章小结开会员,本书免费读 >
SparkSQL是Spark大数据框架的一部分,支持使用标准SQL查询和HiveQL来读写数据,可用于结构化数据处理,并可以执行类似SQL的Spark数据查询,有助于开发人员更快地创建和运行Spark程序。全书分为4篇,共9章,第一篇讲解了SparkSQL发展历史和开发环境搭建。第二篇讲解了SparkSQL实例,使得读者掌握SparkSQL的入门操作,了解SparkRDD、DataFrame和DataSet,并熟悉DataFrame各种操作。第三篇讲解了基于WiFi探针的商业大数据分析项目,实例中包含数据采集、预处理、存储、利用SparkSQL挖掘数据,一步一步带领读者学习SparkSQL强大的数据挖掘功能。第四篇讲解了SparkSQL优化的知识。本书适合Spark初学者、Spark数据分析人员以及Spark程序开发人员,也适合高校和培训学校相关专业的师生教学参考。
品牌:清华大学
上架时间:2018-04-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
Spark SQL入门与实践指南最新章节
查看全部- 9.9 本章小结
- 9.8 Spark SQL解析引擎Catalyst简介
- 9.7 Spark执行引擎Tungsten简介
- 9.6 解决数据倾斜问题
- 9.5 Spark调优七式
- 9.4 Spark编程四大守则
- 9.3 Spark的一些概念
- 9.2 Spark内存简介
- 9.1 Spark执行流程
- 第9章 让Spark程序再快一点
纪涵
主页
最新上架