![Spark SQL入门与实践指南在线阅读](https://wfqqreader-1252317822.image.myqcloud.com/cover/764/26793764/b_26793764.jpg)
会员
Spark SQL入门与实践指南
更新时间:2019-12-06 16:38:46 最新章节:9.9 本章小结
书籍简介
SparkSQL是Spark大数据框架的一部分,支持使用标准SQL查询和HiveQL来读写数据,可用于结构化数据处理,并可以执行类似SQL的Spark数据查询,有助于开发人员更快地创建和运行Spark程序。全书分为4篇,共9章,第一篇讲解了SparkSQL发展历史和开发环境搭建。第二篇讲解了SparkSQL实例,使得读者掌握SparkSQL的入门操作,了解SparkRDD、DataFrame和DataSet,并熟悉DataFrame各种操作。第三篇讲解了基于WiFi探针的商业大数据分析项目,实例中包含数据采集、预处理、存储、利用SparkSQL挖掘数据,一步一步带领读者学习SparkSQL强大的数据挖掘功能。第四篇讲解了SparkSQL优化的知识。本书适合Spark初学者、Spark数据分析人员以及Spark程序开发人员,也适合高校和培训学校相关专业的师生教学参考。
品牌:清华大学
上架时间:2018-04-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
纪涵
同类热门书
最新上架
- 会员人本智造(以人为本的智能制造)体现了工业特别是制造业未来发展的重要趋势,是未来工业(工业5.0)的核心使能技术,是新一代智能制造的重要技术方向。本书深入阐述面向工业5.0的人本智造最新研究成果,包括人的数字孪生、人机协同作业、人机团队合作等,以及相关典型案例,展现了当前国内外人本智造领域的技术进展和应用前景。本书是《人本智造:面向新工业革命的制造模式》一书的姊妹篇,可为从事机械制造业科学研究、企业工业9.6万字
同类书籍最近更新
- 会员《西门子变频器技术入门及实践》主要介绍西门子G120及相关变频器的入门实践操作。本书的特点是从应用角度,先铺垫需要的变频器基础知识,然后以西门子G120变频器为例,按照认知的思维习惯,介绍变频器的硬件、安装、接线、基本调试、设置、通信、维护和调试软件等内容,并从简单的硬件安装开始,循序渐进地介绍变频器相关的实践操作。本书内容图文并茂,浅显易懂,既可以作为大中专院校机电类和自动化类专业课教材,也可以自动化10.8万字
- 会员本书以任务驱动的方式讲解了C语言的基础知识和编程方法。全书共分为10个单元,包括认识C语言程序、C语言程序设计基础、顺序结构程序设计、选择结构程序设计、循环结构程序设计、数组、函数、指针、结构体和文件、项目实训—ATM功能实现。附录中介绍了C语言中的关键字、常用字符与ASCII值对照表、运算符的优先级和结合方向以及常用的C语言标准库函数。本书适合作为高职高专院校C语言课程的教材,也可供C语言初学者自动化8.2万字
- 会员Access2007是MicrosoftOffice2007办公套件中的组件之一,是当今最流行的桌面数据库管理系统。本书以任务驱动和项目教学的方式循序渐进的介绍了Access2007的使用方法和操作技巧,主要内容包括:Access2007使用基础,数据库的设计和创建,表的基本操作,查询的创建和应用,窗体的创建和应用,报表的创建和应用,宏与VBA编程,数据访问页,数据库的维护,进销存管理系自动化15.1万字
- 会员本书面向复杂环境和三维空间无线传感器网络的部署问题,对平面有向传感器网络的部署与优化,以及空间无线传感器网络的部署与目标追踪技术进行研究。主要内容包括:感知角度与感知半径可变的节点感知模型;非均匀势场和复杂区域的节点部署模型;覆盖优先的部署算法、连通优先的部署算法和多中心部署算法等平面有向传感器网络部署算法;三维全向感知节点模型和三维有向感知节点模型;三维空间中任意曲面的部署模型、可移动目标模型、自动化7.3万字
- 会员本书从应用角度出发,以多媒体素材采集制作和多媒体应用软件开发为主线,介绍了多媒体技术的基础理论和多媒体应用系统设计原则,以培养学生工程意识,提高操作能力为目标。全书共分8章,其中包括:多媒体概论、多媒体素材采集、多媒体应用系统设计、音频编辑软件、动画制作软件、视频编辑软件及多媒体创作软件。最后一章通过7个综合实例,详述每个软件进行综合实战的内容及实现过程。自动化10.1万字