SPARK动态添加节点 - - ITeye博客

`

primernd

浏览: 75160 次

最近访客更多访客>>

Peak_

随枫而弑

ganxueyun

无赖木乃伊

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

SPARK动态添加节点

博客分类：

Spark调优

阅读更多

spark集群使用hadoop用户运行,集群机器如下:

1	DEV-HADOOP-01	192.168.9.110	Master
2	DEV-HADOOP-02	192.168.9.111	Worker
3	DEV-HADOOP-03	192.168.9.112	Worker

现在需要添加一台192.168.9.113 机器名DEV-HADOOP-04的节点作为Worker.需要执行一下操作:

配置Master到新增节点hadoop用户的无密码登录
每个节点添加的/etc/hosts
安装JDK1.8.0_60
安装scala
1. 从Master拷贝scala scp -r scala-2.11.7 root@192.168.9.113:/data/server/
2. 设置环境变量 /etc/profile
  1. export SCALA_HOME=/usr/scala/scala-2.11.7
  2. 使配置生效 source /etc/profile
3. 更改scala-2.11.7的用户和组 chown -R hadoop:hadoop scala-2.11.7
安装spark
1. 从Master拷贝spark scp -r spark-1.5.0-bin-hadoop2.6 root@192.168.9.113:/data/server/
2. 配置环境变量 /etc/profile
  1. export SPARK_HOME=/data/server/spark-1.5.0-bin-hadoop2.6
  2. export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin
  3. 使配置生效 source /etc/profile
修改集群的slaves配置文件,新增新增节点DEV-HADOOP-03
启动新增节点
1. sbin/start-slave.sh spark://DEV-HADOOP-01:7077
新增节点启动验证
1. 执行jps命令,slave可以看到Worker进程
查看Spark UI
1. 看到Workers中有新增节点

分享到：

SPARK启动历史任务查看 | SPARK standlone安装配置

2016-06-27 12:12
浏览 788
评论(0)
分类:编程语言
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

循环向数据库添加数据: 循环向数据库中添加数据建好序列不用手动添加

大数据学习笔记: 第2章 Spark弹性分布数据集 9 2.1 弹性分布式数据集 9 2.2 MapReduce数据分享效率低 9 2.3 MapReduce进行迭代操作 9 2.4 MapReduce进行交互操作 10 2.5 Spark RDD数据分享 10 2.6 Spark RDD 迭代操作 10 2.7 Spark ...

从小火苗到燃烧的火车：Spark大数据处理秘籍.zip: spark本文将为您介绍一款强大的大数据处理工具——Spark。它以独特的火苗形象，为大数据处理提供了快速、通用和可扩展的能力。本文将围绕Spark的基本概念、使用方法和功能进行讲解，帮助您快速上手Spark。知识领域...

sparkstreaming:封装sparkstreaming动态调节batch time(有数据就执行计算)；支持运行过程中增删topic；封装sparkstreaming 1.6 - kafka 010 用以支持 SSL: 支持在streaming过程中重设 topics，用于生产中动态地增加删减数据源添加了速率控制，KafkaRateController。用来控制读取速率，由于不是用的sparkstreaming，所有速率控制的一些参数拿不到，得自己去计算。提供...

spark-dynamodb:适用于AWS DynamoDB的Apache Spark自定义数据源的即插即用实现: 适用于AWS DynamoDB的Apache Spark自定义数据源的即插即用实现。我们发布了有关该项目的小文章，请在此处查看： : 消息 2021-01-28：添加了选项inferSchema=false ，该选项在写入具有许多列的表时非常有用 2020-...

Spark升级后无Logging类: 在使用spark读取kafka数据时，当spark升级到2.0之后，出现如上问题：之前遇到了，当时在工程里面添加了org.apache.spark.Logging类，能够运行。

Python+Spark+Hadoop大数据基于用户画像电影推荐系统设计: 本系统是以Django作为基础框架，采用MTV模式，数据库使用MySQL和Redis，以从豆瓣平台爬取的电影数据作为基础数据源，主要基于用户的基本信息和使用操作记录等行为信息来开发用户标签，并使用Hadoop、Spark大数据...

论文研究-基于Spark的并行化协同深度推荐模型.pdf: 同时对算法进行并行化改进，通过对模型进行拆分，提出一种并行训练CDL-i的方法，将其移植到Spark分布式集群上，并行地对模型各部分参数进行训练优化，增强模型所能处理数据的规模和扩展性。通过在多个真实数据集上的...

spark-webhook-redirector:使用单个 spark.io webhook 并根据事件数据重定向流量: 使用单个 spark.io webhook 并根据 PUT 数据重定向流量。设置 Spark 驱动的设备以发布事件。以下是按指定时间间隔发布温度的传感器示例： : 。在 firebase.io 上创建一个（免费）应用程序来存储您的数据。 ...

javashuffle源码-spark-data-sources:使用V2API开发Spark外部数据源: 的主要目标（未来可能会添加 Scala 版本）一系列 Spark 示例来练习实现的各种数据源（现在也使用 Java）该项目已从以下较旧的项目中分拆出来： -- Scala 中的大量 Spark 示例 -- Java 中的一小部分 Spark 示例 -- ...

spark-sftp:SFTP的Spark连接器: Spark SFTP连接器库通过从SFTP下载文件并将数据帧写入SFTP服务器来构造数据帧的库要求该库需要Spark2.x。...可以使用--packages命令行选项将此软件包添加到Spark。例如，在启动spark shell时将其包括在内：

spark升级后无logging类: 在使用spark读取kafka数据时，当spark升级到2.0之后，出现如上问题：之前遇到了，当时在工程里面添加了org.apache.spark.Logging类，能够运行。

Spark、Hadoop大数据平台搭建.pdf: Spark、Hadoop⼤数据平台搭建下载安装包 Spark 分布式计算，安装包⼤⼩：220M ⽀持Hadoop 2.7以后的版本 Scala Scala环境，Spark的开发语⾔，安装包⼤⼩：20M Hadoop 分布式存储（计算），安装包⼤⼩：209M Java...

ruby-spark：Apache Spark的Ruby包装器: Apache Spark:trade_mark:是用于大规模数据处理的快速通用引擎。该Gem允许在Ruby上使用Spark功能。 Spark的Ruby API中的字数统计 file = spark . text_file ( "hdfs://..." ) file . flat_map ( :split ...

w2v：使用Spark使用Twitter数据对Word2Vec进行建模。博客：: 基于Spark的机器学习，用于捕获词义在此存储库中，您将了解如何使用Twitter数据构建Word2Vec模型。要获得有关如何在IBM 上构建模型的...）在这里添加了一个笔记本带有Twitter数据usign Spark RDDs.ipynb，好消息是Spar

IQL:An ad hoc query service based on the spark sql engine.(基于spark sql引擎的即席查询服务): 基于Structured Streaming实现SQL动态添加流类似SparkShell交互式数据分析功能高效的script管理，配合import/include语法完成各script的关联对数据源操作的权限验证支持的数据源：hdfs、hive、hbase、kafka、...

SparkCube:SparkCube是一个开源项目，用于极快速的OLAP数据分析。 SparkCube是Apache Spark的扩展: 您应该将几个配置添加到Spark配置中。配置价值评论 spark.sql.extensions com.alibaba.sparkcube.SparkCube 添加扩展名。必需的 spark.sql.cache.tab.display 真的要在特定应用程序（通常是Spark Thrift...

spark-dbf:Spark SQL DBF 库: Spark SQL DBF 库使用查询数据的库。这是正在进行中的工作，基于项目。 “Ye Olde”DBF 文件格式像现代 Avro 格式一样封装数据和模式。...spark-dbf jar 文件也可以使用--jars命令行选项添加到 Spark。

spark-rabbitmq：RabbitMQ Spark流媒体接收器: [ ]（）RabbitMQ Spark流媒体接收器RabbitMQ-Receiver是一个库，允许用户使用读取数据。要求该库需要Spark 2.0 +，Scala 2.11 +，RabbitMQ 3.5+使用图书馆有两种使用RabbitMQ-Receiver库的方法：第一个是在pom.xml...

SparkR安装部署及数据分析实例: }1488次浏览评价：好中差 1.SparkR的安装配置1.1.R与Rstudio的安装1.1.1.R的安装我们的工作环境都是在Ubuntu下操作的，所以只介绍Ubuntu下安装R的方法：1）在/etc/apt/sources.list添加源debhttp://...

Global site tag (gtag.js) - Google Analytics