列表格式显示

11教育教学 - 分类

广告招商中......
联系方式!

电子图书 - 时间排序 更多...
    电子图书 - 点击排序 更多...
      电子图书 - 大小排序 更多...
        作者

         

        最近发布的软件 更多>>

        首页 >> 11教育教学>> 电子图书>>spark编程指南中文版 发布者:admin >> 本人发布的更多软件

        广告招商中...... 联系方式!

        spark编程指南中文版 

        时间:2024-01-01 03:21:45      作者:admin     访问量:1  
             
        软件厂家: 官方网站:
        大小: 语言:
        类型: 类别:
        更新时间: 运行环境:
        ;开始下载地址

        spark编程指南 pdf 是一部非常实用的spark教程,这部电子书详细讲解了spark编程方法以及技巧,能够让你快速入门,需要的朋友欢迎来绿色资源网免费下载!

        spark编程指南pdf

        spark编程指南电子书介绍

        总体上来说,每个spark应用都包含一个驱动器(driver)程序,驱动器运行用户的main函数,并在集群上执行各种并行操作。

        spark最重要的一个抽象概念就是弹性分布式数据集(resilient distributed dataset – rdd),rdd是一个可分区的元素集合,其包含的元素可以分布在集群各个节点上,并且可以执行一些分布式并行操作。rdd通常是通过,hdfs(或者其他hadoop支持的文件系统)上的文件,或者驱动器中的scala集合对象,来创建或转换得到;其次,用户也可以请求spark将rdd持久化到内存里,以便在不同的并行操作里复用之;最后,rdd具备容错性,可以从节点失败中自动恢复数据。

        spark第二个重要抽象概念是共享变量,共享变量是一种可以在并行操作之间共享使用的变量。默认情况下,当spark把一系列任务调度到不同节点上运行时,spark会同时把每个变量的副本和任务代码一起发送给各个节点。但有时候,我们需要在任务之间,或者任务和驱动器之间共享一些变量。spark提供了两种类型的共享变量:广播变量和累加器,广播变量可以用来在各个节点上缓存数据,而累加器则是用来执行跨节点的“累加”操作,例如:计数和求和。

        spark编程指南pdf目录

        1. introduction

        2. 快速上手

        i. sparkshell

        ii. 独立应用程序

        iii. 开始翻滚吧!

        3. 编程指南

        i. 引入spark

        ii. 初始化spark

        iii. sparkrdds

        i. 并行集合

        ii. 外部数据集

        iii. rdd操作

        i. 传递函数到spark

        ii. 使用键值对

        iii. transformations

        iv. actions

        iv. rdd持久化

        iv. 共享变量

        v. 从这里开始

        4. sparkstre

        i. 一个快速的例子

        ii. 基本概念

        i. 关联

        ii. 初始化streamingcontext

        iii. 离散流

        iv. 输入dstreams

        v. dstream中的转换

        vi. dstream的输出操作

        vii. 缓存或持久化

        viii. checkpointing

        ix. 部署应用程序

        x. 监控应用程序

        iii. 性能调优

        i. 减少批数据的执行时间

        ii. 设置正确的批容量

        iii. 内存调优

        iv. 容错语义

        5. sparksql

        i. 开始

        ii. 数据源

        i. rdds

        ii. parquet文件

        iii. json数据集

        iv. hive表

        iii. 性能调优

        iv. 其它sql接口

        v. 编写语言集成(language-integrated)的相关查询

        vi. sparksql数据类型

        6. graphx编程指南

        i. 开始

        ii. 属性图

        iii. 图操作符

        tableofcontentsiv. pregelapi

        v. 图构造者

        vi. 顶点和边rdds

        vii. 图算法

        viii. 例子

        7. 部署

        i. 提交应用程序

        ii. 独立运行spark

        iii. 在yarn上运行spark

        8. 更多文档

        i. spark配置


        本页Html网址:/htmlsoft/60755.html

        本页aspx网址:/soft.aspx?id=60755&bianhao=20240101_032145_354511&kind1=11教育教学&kind2=电子图书

        最后访问时间:

        上一篇:法律英语何家弘电子版

        下一篇:电路基础第五版pdf

        增加   


        相关评论        新窗口打开查看评论