关于IDEA创建spark maven项目并连接远程spark集群问题_Java教程

关于IDEA创建spark maven项目并连接远程spark集群问题

2021-12-10 11:01PolarisHuster Java教程

这篇文章主要介绍了IDEA创建spark maven项目并连接远程spark集群,本文给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下

环境：

scala：2.12.10

spark：3.0.3

1、创建scala maven项目，如下图所示：

关于IDEA创建spark maven项目并连接远程spark集群问题 2、

不同版本scala编译参数可能略有不同，笔者使用的scala版本是2.12.10，scala-archetype-simple插件生成的pom文件

				?

									<plugin>

									  <groupid>org.scala-tools</groupid>

									  <artifactid>maven-scala-plugin</artifactid>

									  <version>2.15.0</version>

									  <executions>

									    <execution>

									      <goals>

									        <goal>compile</goal>

									        <goal>testcompile</goal>

									      </goals>

									      <configuration>

									        <args>

									          <arg>-make:transitive</arg>

									          <arg>-dependencyfile</arg>

									          <arg>${project.build.directory}/.scala_dependencies</arg>

									        </args>

									      </configuration>

									    </execution>

									  </executions>

									</plugin>

要去除-make:transitive这个参数，否则会报错。

3、创建sparkpi object类

				?

									object sparkpi {

									  def main(args: array[string]): unit = {

									    val spark = sparksession

									      .builder

									      .appname("spark pi")

									      .master("spark://172.21.212.114:7077")

									      .config("spark.jars","e:\\work\\polaris\\polaris-spark\\spark-scala\\target\\spark-scala-1.0.0.jar")

									      .config("spark.executor.memory","2g")

									      .config("spark.cores.max","2")

									      .config("spark.driver.host", "172.21.58.28")

									      .config("spark.driver.port", "9089")

									      .getorcreate()

									    //spark = new sparkcontext(conf).

									    val slices = if (args.length > 0) args(0).toint else 2

									    val n = math.min(100000l * slices, int.maxvalue).toint // avoid overflow

									    val count = spark.sparkcontext.parallelize(1 until n, slices).map { i =>

									      val x = random * 2 - 1

									      val y = random * 2 - 1

									      if (x*x + y*y <= 1) 1 else 0

									    }.reduce(_ + _)

									    println(s"pi is roughly ${4.0 * count / (n - 1)}")

									    spark.stop()

									  }

									}